_python_内存溢出

(一)朴素贝叶斯与贝叶斯分类器基础知识
- 基础知识点:
- 条件概率:
- 贝叶斯公式:
- 全概率公式:
- 贝叶斯推断:
- 朴素贝叶斯分类器的例子:

(一)朴素贝叶斯与贝叶斯分类器基础知识基础知识点:

贝叶斯分类算法是统计学的一种概率分类方法, 朴素贝叶斯分类是贝叶斯分类中最简单的一种.
其分类原理就是利用贝叶斯公式根据某特征的先验概率计算出其后验概率, 然后选择具有最大后验概率的类作为该特征所属的类.
之所以称之为“朴素”, 是因为贝叶斯分类只做最原始、最简单的假设: 所有的特征之间是统计独立的, 即:

假设某样本 P ( X ) P(X) P(X)有 a 1 , … , a n a_1,…,a_n a1,…,an个属性, 那么有: P ( X ) = P ( a 1 , … , a n ) = P ( a 1 ) P ( a 2 ) … P ( a n ) P(X)=P(a_1,…,a_n )=P(a_1)P(a_2)…P(a_n) P(X)=P(a1,…,an)=P(a1)P(a2)…P(an)

条件概率:

P ( A ∣ B ) = P ( A ∩ B ) P ( B ) P(A|B)=\dfrac{P(A∩B)}{P(B)} P(A∣B)=P(B)P(A∩B)
有: P ( A ∩ B ) = P ( A ∣ B ) P ( B ) , P ( A ∩ B ) = P ( B ∣ A ) P ( A ) P(A∩B)=P(A|B)P(B), P(A∩B)=P(B|A)P(A) P(A∩B)=P(A∣B)P(B),P(A∩B)=P(B∣A)P(A)
进一步: P ( A ∣ B ) P ( B ) = P ( B ∣ A ) P ( A ) P(A|B)P(B)=P(B|A)P(A) P(A∣B)P(B)=P(B∣A)P(A)

如果 A i A_i Ai独立同分布, P ( B ∣ A ) = P ( B ∣ A 1 ) … P ( B ∣ A n ) P(B|A)=P(B|A_1 )…P(B|A_n ) P(B∣A)=P(B∣A1)…P(B∣An)

贝叶斯公式:

因此贝叶斯公式为:
P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A|B)=P(B|A)\dfrac{P(A)}{P(B)} P(A∣B)=P(B∣A)P(B)P(A)

全概率公式:

如果事件 A = A 1 , … , A n A={A_1,…,A_n} A=A1,…,An构成一个完备事件组且 P ( A i ) > 0 P(A_i )>0 P(Ai)>0, 那么对于任意一个事件 B B B则有:
P ( B ) = P ( B ⋅ 1 ) = P ( B A 1 ) + ⋯ + P ( B A n ) = P ( B ∣ A 1 ) P ( A 1 ) + ⋯ + P ( B ∣ A n ) P ( A n ) P(B)=P(B⋅1)=P(BA_1 )+⋯+P(BA_n )=P(B|A_1 )P(A_1 )+⋯+P(B|A_n )P(A_n ) P(B)=P(B⋅1)=P(BA1)+⋯+P(BAn)=P(B∣A1)P(A1)+⋯+P(B∣An)P(An)

因此有:
P ( B ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(B)=∑_{i=1}^nP(A_i )P(B|A_i ) P(B)=i=1∑nP(Ai)P(B∣Ai)

贝叶斯推断:

根据条件概率和全概率公式, 贝叶斯公式为:
P ( A ∣ B ) = P ( A ) P ( B ∣ A ) P ( B ) P(A|B)=P(A)\dfrac{P(B|A)}{P(B)} P(A∣B)=P(A)P(B)P(B∣A)
P ( A i ∣ B ) = P ( A i ) P ( B ∣ A i ) P ( B ) = P ( A i ) P ( B ∣ A i ) ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(A_i |B)=P(A_i )\dfrac{P(B|A_i )}{P(B)} =P(A_i ) \dfrac{P(B|A_i )}{∑_{i=1}^nP(A_i )P(B|A_i ) } P(Ai∣B)=P(Ai)P(B)P(B∣Ai)=P(Ai)∑i=1nP(Ai)P(B∣Ai)P(B∣Ai)
P ( A ) P(A) P(A)是类先验概率(Prior probability), 即在 B B B事件发生之前, 我们对 A A A事件概率的一个判断.
P ( A ∣ B ) P(A|B) P(A∣B)是类后验概率(Posterior probability)/类条件概率, 即在 B B B事件发生之后, 我们对A事件概率的重新评估. 贝叶斯分类器算的就是 P ( A ∣ B ) P(A|B) P(A∣B).
P ( B ∣ A ) P ( B ) \dfrac{P(B|A)}{P(B)} P(B)P(B∣A)是可能性函数(Likely hood), 这是一个调整因子, 使得预估概率更接近真实概率.

所以: 后验概率 = 先验概率 * 调整因子.

如果 P ( B ∣ A ) P ( B ) > 1 \dfrac{P(B|A)}{P(B)} >1 P(B)P(B∣A)>1, 意味着 “先验概率” 被增强, 事件 A A A的发生可能性变大;
如果 P ( B ∣ A ) P ( B ) = 1 \dfrac{P(B|A)}{P(B)} =1 P(B)P(B∣A)=1, 意味着 B B B事件无助于判断事件 A A A发生的可能性;
如果 P ( B ∣ A ) P ( B ) < 1 \dfrac{P(B|A)}{P(B)} <1 P(B)P(B∣A)<1, 意味着 “先验概率” 被削弱, 事件 A A A的发生可能性变小.

朴素贝叶斯分类器的例子:

图1 特性-分类的统计数据

假设某男子(帅, 性格不好, 不上进)向该女生求婚, 该女生嫁还是不嫁？
P ( A ∣ B ) = P ( A ) P ( B ∣ A ) P ( B ) P(A|B)=P(A)\dfrac{P(B|A)}{P(B)} P(A∣B)=P(A)P(B)P(B∣A)
转换成任务表达式: P ( 类别 ∣ 特征 ) = P ( 类别 ) P ( 特征 ∣ 类别 ) P ( 特征 ) P(类别|特征)=P(类别)\dfrac{P(特征|类别)}{P(特征)} P(类别∣特征)=P(类别)P(特征)P(特征∣类别) ; A A A和 A ˉ \bar{A} Aˉ为类别; B i B_i Bi为不同的特征
在朴素贝叶斯中, 假设类别B中的属性是相互独立的, 即 P ( B ∣ A ) = P ( B 1 ∣ A ) … P ( B m ∣ A ) , P(B|A)=P(B_1 |A)…P(B_m |A), P(B∣A)=P(B1∣A)…P(Bm∣A), 所以:
P ( A ∣ B ) = P ( A ) ) P ( B 1 ∣ A ) P ( B 2 ∣ A ) P ( B 3 ∣ A ) P ( A ) P ( B 1 ∣ A ) P ( B 2 ∣ A ) P ( B 3 ∣ A ) + P ( A ˉ ) P ( B 1 ∣ A ˉ ) P ( B 2 ∣ A ˉ ) P ( B 3 ∣ A ˉ ) P(A|B)=P(A))\dfrac{P(B_1 |A)P(B_2 |A)P(B_3 |A)}{P(A)P(B_1 |A)P(B_2 |A)P(B_3 |A)+P(\bar{A})P(B_1 |\bar{A})P(B_2 |\bar{A})P(B_3 |\bar{A})} P(A∣B)=P(A))P(A)P(B1∣A)P(B2∣A)P(B3∣A)+P(Aˉ)P(B1∣Aˉ)P(B2∣Aˉ)P(B3∣Aˉ)P(B1∣A)P(B2∣A)P(B3∣A)

P ( A ˉ ∣ B ) = P ( A ˉ ) P ( B 1 ∣ A ˉ ) P ( B 2 ∣ A ˉ ) P ( B 3 ∣ A ˉ ) P ( A ) P ( B 1 ∣ A ) P ( B 2 ∣ A ) P ( B 3 ∣ A ) + P ( A ˉ ) P ( B 1 ∣ A ˉ ) P ( B 2 ∣ A ˉ ) P ( B 3 ∣ A ˉ ) P(\bar{A}|B)=P(\bar{A})\dfrac{P(B_1 |\bar{A})P(B_2 |\bar{A})P(B_3 |\bar{A})}{P(A)P(B_1 |A)P(B_2 |A)P(B_3 |A)+P(\bar{A})P(B_1 |\bar{A})P(B_2 |\bar{A})P(B_3 |\bar{A})} P(Aˉ∣B)=P(Aˉ)P(A)P(B1∣A)P(B2∣A)P(B3∣A)+P(Aˉ)P(B1∣Aˉ)P(B2∣Aˉ)P(B3∣Aˉ)P(B1∣Aˉ)P(B2∣Aˉ)P(B3∣Aˉ)

问题的解决方法是: 最后算出来 P ( 嫁 ∣ 帅 ; 性格不好 ; 不上进 ) P(嫁|帅;性格不好;不上进) P(嫁∣帅;性格不好;不上进)和 P ( 不嫁 ∣ 帅 ; 性格不好 ; 不上进 ) P(不嫁|帅;性格不好;不上进) P(不嫁∣帅;性格不好;不上进)的概率, 哪个值大就选哪一个. 其中:
P ( 嫁 ∣ 帅 ; 性格不好 ; 不上进 ) = P ( 嫁 ) ( P ( 帅 ∣ 嫁 ) P ( 性格不好 ∣ 嫁 ) P ( 不上进 ∣ 嫁 ) ) P ( 帅 ; 性格不好 ; 不上进 ) P(嫁|帅;性格不好;不上进)=P(嫁)\dfrac{(P(帅|嫁)P(性格不好|嫁)P(不上进|嫁))}{P(帅;性格不好;不上进)} P(嫁∣帅;性格不好;不上进)=P(嫁)P(帅;性格不好;不上进)(P(帅∣嫁)P(性格不好∣嫁)P(不上进∣嫁))

P ( 不嫁 ∣ 帅 ; 性格不好 ; 不上进 ) = P ( 不嫁 ) ( P ( 帅 ∣ 不嫁 ) P ( 性格不好 ∣ 不嫁 ) P ( 不上进 ∣ 不嫁 ) ) P ( 帅 ; 性格不好 ; 不上进 ) P(不嫁|帅;性格不好;不上进)=P(不嫁)\dfrac{(P(帅|不嫁)P(性格不好|不嫁)P(不上进|不嫁))}{P(帅;性格不好;不上进)} P(不嫁∣帅;性格不好;不上进)=P(不嫁)P(帅;性格不好;不上进)(P(帅∣不嫁)P(性格不好∣不嫁)P(不上进∣不嫁))

由 P ( B ) = ∑ i = 1 n P ( A i ) P ( B ∣ A i ) P(B)=∑_{i=1}^nP(A_i )P(B|A_i ) P(B)=∑i=1nP(Ai)P(B∣Ai) :
P ( 帅 ; 性格不好 ; 不上进 ) = P ( 嫁 ) P ( 帅 │ 嫁 ) P ( 性格不好 │ 嫁 ) P ( 不上进 │ 嫁 ) + P ( 不嫁 ) P ( 帅 │ 不嫁 ) P ( 性格不好 │ 不嫁 ) P ( 不上进 │ 不嫁 ) P(帅;性格不好;不上进)=P(嫁)P(帅│嫁)P(性格不好│嫁)P(不上进│嫁)+P(不嫁)P(帅│不嫁)P(性格不好│不嫁)P(不上进│不嫁) P(帅;性格不好;不上进)=P(嫁)P(帅│嫁)P(性格不好│嫁)P(不上进│嫁)+P(不嫁)P(帅│不嫁)P(性格不好│不嫁)P(不上进│不嫁)
由表中数据, 有:
分子:
P ( 嫁 ) P ( 帅 │ 嫁 ) P ( 性格不好 │ 嫁 ) P ( 不上进 │ 嫁 ) = 5 / 10 × 4 / 5 × 1 / 5 × 1 / 5 = 2 / 125 P(嫁)P(帅│嫁)P(性格不好│嫁)P(不上进│嫁)=5/10×4/5×1/5×1/5=2/125 P(嫁)P(帅│嫁)P(性格不好│嫁)P(不上进│嫁)=5/10×4/5×1/5×1/5=2/125
P ( 不嫁 ) P ( 帅 │ 不嫁 ) P ( 性格不好 │ 不嫁 ) P ( 不上进 │ 不嫁 ) = 5 / 10 × 1 / 5 × 3 / 5 × 2 / 5 = 3 / 125 P(不嫁)P(帅│不嫁)P(性格不好│不嫁)P(不上进│不嫁)=5/10×1/5×3/5×2/5=3/125 P(不嫁)P(帅│不嫁)P(性格不好│不嫁)P(不上进│不嫁)=5/10×1/5×3/5×2/5=3/125
分母:

P ( 帅 ; 性格不好 ; 不上进 ) = 2 / 125 + 3 / 125 = 5 / 125 P(帅;性格不好;不上进)=2/125+3/125=5/125 P(帅;性格不好;不上进)=2/125+3/125=5/125
最终结果:
P ( 嫁 ∣ 帅 ; 性格不好 ; 不上进 ) = 2 / 125 ÷ / 5 / 125 = 0.4 P(嫁|帅;性格不好;不上进)=2/125÷/5/125=0.4 P(嫁∣帅;性格不好;不上进)=2/125÷/5/125=0.4
P ( 不嫁 ∣ 帅 ; 性格不好 ; 不上进 ) = 3 / 125 ÷ 5 / 125 = 0.6 P(不嫁|帅;性格不好;不上进)=3/125÷5/125=0.6 P(不嫁∣帅;性格不好;不上进)=3/125÷5/125=0.6