贝叶斯概率公式

贝叶斯概率公式,第1张

贝叶斯概率公式:

贝叶斯概率公式由英国数学家贝叶斯 ( Thomas Bayes 1702-1761 ) 发展,用来描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。按照乘法法则,可以立刻导出:P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)。如上公式也可变形为:P(A|B)=P(B|A)*P(A)/P(B)。

作为一个规范的原理,贝叶斯法则对于所有概率的解释是有效的;然而,频率主义者和贝叶斯主义者对于在应用中概率如何被赋值有着不同的看法:频率主义者根据随机事件发生的频率,或者总体样本里面的个数来赋值概率;贝叶斯主义者要根据未知的命题来赋值概率。

一个结果就是,贝叶斯主义者有更多的机会使用贝叶斯法则。贝叶斯法则是关于随机事件A和B的条件概率和边缘概率的。

贝叶斯公式,是指当分析样本大到接近总体数时答胡,样本中事件发生的概率将接近于总体中事件发生的概率。但行为经济学家发毕激现,人们在决策过程中往往并不遵循贝叶斯规律,而是给予最近发生的事件和最新的清数拦经验以更多的权值,在决策和做出判断时过分看重近期的事件。

朴素贝叶斯算法属于分类算法。发源于古典数学理论,对缺失数据不太敏感,有稳定的分类效率模缺,模型所需估计的参数很少,算法比较简单。

朴素贝叶斯算法 贝叶斯 是说明这个算法和贝叶斯定理有联系,而 朴素 是因为处理实际的需要,做了一个简化—— 假设每个特征之间是独立的 (如果研究的对象互相之间的影响很强,计算概率时考虑的问题非常复杂,做了独立假设,就可以分解后进行研究),这是这个算法模型与贝叶斯定理的区别。

将 x 作为特征,y 作为类别,那公式左边的 P(yi|x)就是说在知道特征 x 的情缺码虚况下,计算这个特征属于 yi 类的可能性大小。通过比较找出这个可能性的值最大的属于哪一类,就将特征 x 归为这一类。

第3步的计算就是整个关键所在,计算依据是上面的贝叶斯公式。

对于每一个类的概率计算,公式右边的分母的 P(x)都是相同的,所以可以不计算(我们只是对最终结果进行比较,不影响)。

P(yi)也称为先验概率,是 x 属于 yi 类的一个概率,这个是通过历史信息得到的(在程序实现的时候,历史信息或者说先验信息就是我们的训练数据集),我们伏燃通过对训练样本数据进行统计,分别算出 x 属于 y1,y2,...,yn 类的概率是多少,这个是比较容易得到的。

所以,主要是求 P(x|yi)= P(a1,a2,...,am|yi)

这个时候对于贝叶斯模型的 朴素 的独立性假设就发挥作用了(综合的计算变成了独立计算后的综合,简化模型,极大地减少了计算的复杂程度):

P(a1,a2,...,am|yi) = P(a1|yi)P(a2|yi)...P(am|yi)

所以计算想要得到的东西如下:

一个程序简例

贝叶迅喊斯公式:

推导之前,我们需要先了解一下 条件概率 :

已知数圆昌态据如下:

P(A) 表是人为光头的概率,P(B) 表示为人为程序员的概率。

则 P(A) = 4/9 ,P(B) = 3/9 = 1/3 ,P(A, B) = 2/9

P(A|B) 则为程序员中光头的概率为:2/3

P(B|A) 则为光头中程序员的概率:2/4 = 1/2

则按照条件概率:P(A|B) = P(A, B)/ P(B) = 2/3

贝叶斯公式:P(A|B) = P(A)·P(B|A)/P(B) = 2/3

通过上面连个公式推导发现 条件概率 和 贝叶斯 的结果是一样的橘源。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12450794.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-25
下一篇 2023-05-25

发表评论

登录后才能评论

评论列表(0条)

保存