概率论 中心极限定理 大数定理

概率论 中心极限定理 大数定理,第1张

把200台电话机编号,从1到200,对于每台电话i,使用随机标记函数 Hi,
当i 需要使用外线时,Hi=1, 当i 不需要使用外线时,Hi=0
考虑随机变量 Y=Σ_(1<=i<=200) Hi,由Hi的定义,可知,Y的值表示同一时间内需要使用外线的电话数量。90%以上的概率保证每台电话机需要使用外线时不被占用,即要找到一个最小x值,使得概率 P(Y<=x) >= 09 。或P(Y<=x) = 09
考虑随机变量 Y/200 = (1/200)Σ_(1<=i<=200) Hi ,由中心极限定理,
Y/200 近似于 正态分布 N(m, v), 其中 均值 m=E(Hi)=005, 方差 v=V(Hi) / 200 = 005095 / 200
所以,要求
09 = P(Y<=x) = P(Y/200<=x/200) = P(Y/200-m<=x/200-m) =P( [Y/200-m] / √v<=[x/200-m] / √v)
显然,[Y/200-m] / √v 近似于标准正态分布 N(0, 1),所以,
[x/200-m] / √v 应该为 标准正态分布 N(0, 1) 90% 的quantile(分位点)。
所以 [x/200-m] / √v =128, 最后
x = 200(128 √v +m) = 10+ 128 √(200005095) = 1395,
应取大于这个值的最小整数,所以 x=14

大数定律(lawoflargenumbers),是一种描述当试验次数很大时所呈现的概率性质的定律。但是注意到,大数定律并不是经验规律,而是在一些附加条件上经严格证明了的定理。它是一种自然规律因而通常不叫定理而是大数“定律”。

在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。通俗地说,这个定理就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。偶然中包含着某种必然。

扩展资料:

在数学与统计学中,大数定律又称大数法则、大数律,是描述相当多次数重复实验的结果的定律。根据这个定律知道,样本数量越多,则其算术平均值就有越高的概率接近期望值。

大数定律很重要,因为它“说明”了一些随机事件的均值的长期稳定性。人们发现,在重复试验中,随着试验次数的增加,事件发生的频率趋于一个稳定值;人们同时也发现,在对物理量的测量实践中,测定值的算术平均也具有稳定性。

参考资料:

百度百科-大数定律

参考资料:

百度百科-大数律

大数定律又称大数法则、大数率。 在一个随机事件中,随着试验次数的增加,事件发生的频率趋于一个稳定值;同时,在对物理量的测量实践中,大量测定值的算术平均也具有稳定性。 在数理统计中,一般有三个定理,贝努利定理和辛钦定理,如:反映算术平均值和频率的稳定性。当n很大时,算术平均值接近数学期望;频率以概率收敛于事件的概率

概率论历史上第一个极限定理属于伯努利,后人称之为“大数定律”。概率论中讨论随机变量序列的算术平均值向常数收敛的定律。概率论与数理统计学的基本定律之一,又称弱大数理论。
大数定律(law of large numbers),又称大数定理[1] ,是一种描述当试验次数很大时所呈现的概率性质的定律。但是注意到,虽然通常最常见的称呼是大数“定律”,但是大数定律并不是经验规律,而是严格证明了的定理。
有些随机事件无规律可循,但不少是有规律的,这些“有规律的随机事件”在大量重复出现的条件下,往往呈现几乎必然的统计特性,这个规律就是大数定律。确切的说大数定律是以确切的数学形式表达了大量重复出现的随机现象的统计规律性,即频率的稳定性和平均结果的稳定性,并讨论了它们成立的条件。[2]
简单地说,大数定理就是“当试验次数足够多时,事件出现的频率无穷接近于该事件发生的概率”。该描述即贝努利大数定律。

大数定律有很多种,一般是iid(独立同分布)的话,是辛钦大数律,然后就是马尔科夫大数律比较强一点,前面的几个大数律是他的特例,具体的话随便翻本概率论的书都有,
至于用于什么场合的话,这个不好说,最常见的肯定是统计里证明强相合弱相合的地方

一、中心极限定理
1、定义
(1)样本的平均值约等于总体的平均值。
(2)不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的整体平均值周围,并且呈正态分布。
(3)样本大小必须达到30,中心极限定理才能保证成立。
2、结论:
(1)用样本来估计总体
任何一个样本的平均值将会约等于其所在总体的平均值。
(2)样本平均值呈正态分布
取样次数越多,结果就越接近正态分布;而且样本大小越大,分布就越接近正态分布。
3、作用
(1)在没有办法得到总体全部数据的情况下,我们可以用样本来估计总体。
(2)根据总体的平均值和标准差,判断某个样本是否属于总体。
4、示例
假设有一个群体,如我们之前提到的清华毕业的人,我们对这类人群的收入感兴趣。怎么知道这群人的收入呢?我会做这样4步:
(1)随机抽取1个样本,求该样本的平均值。例如我们抽取了100名毕业于清华的人,然后对这些人的收入求平均值。
该样里的100名清华的人,这里的100就是该样本的大小。
有一个经验是,样本大小必须达到30,中心极限定理才能保证成立。
(2)我将第1步样本抽取的工作重复再三,不断地从毕业的人中随机抽取100个人,例如我抽取了5个样本,并计算出每个样本的平均值,那么5个样本,就会有5个平均值。
这里的5个样本,就是指样本数量是5。
(3)根据中心极限定理,这些样本平均值中的绝大部分都极为接近总体的平均收入。有一些会稍高一点,有一些会稍低一点,只有极少数的样本平均值大大高于或低于群体平均值。
(4)中心极限定理告诉我们,不论所研究的群体是怎样分布的,这些样本平均值会在总体平均值周围呈现一个正态分布。

二、大数定理
是一种描述当试验次数很大时所呈现的概率性质的定律。在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。
通俗地说,这个定理就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。偶然中包含着某种必然。

三、两者之间的区别
大数定律是说,n只要越来越大,我把这n个独立同分布的数加起来去除以n得到的这个样本均值(也是一个随机变量)会依概率收敛到真值u,但是样本均值的分布是怎样的我们不知道。
中心极限定理是说,n只要越来越大,这n个数的样本均值会趋近于正态分布,并且这个正态分布以u为均值,sigma^2/n为方差。
综上所述,这两个定律都是在说样本均值性质。随着n增大,大数定律说样本均值几乎必然等于均值。中心极限定律说,他越来越趋近于正态分布。并且这个正态分布的方差越来越小。
直观上来讲,想到大数定律的时候,你脑海里浮现的应该是一个样本,而想到中心极限定理的时候脑海里应该浮现出很多个样本。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/yw/12862062.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-28
下一篇 2023-05-28

发表评论

登录后才能评论

评论列表(0条)

保存