使用Python构造经验累积分布函数(ECDF)

使用Python构造经验累积分布函数(ECDF),第1张

对于一个样本序列 ,经验累积分布函数 (Empirical Cumulative Distribution Function)可被定义为

其中 是一个指示函数,如果 ,指示函数取值为1,否则取值为0,因此 能反映在样本中小于 的元素数量占比。

根据格利文科定理(Glivenko–Cantelli Theorem),如果一个样本满足独立同分布(IID),那么其经验累积分布函数 会趋近于真实的累积分布函数 。

首先定义一个类,命名为ECDF:

我们采用均匀分布(Uniform)进行验证,导入 uniform 包,然后进行两轮抽样,第一轮抽取10次,第二轮抽取1000次,比较输出的结果。

输出结果为:

而我们知道,在真实的0到1均匀分布中, 时, ,从模拟结果可以看出,样本量越大,最终的经验累积分布函数值也越接近于真实的累积分布函数值,因此格利文科定理得以证明。

样本经验测度。根据查询相关公开信息显示,统计学中,经验分布函数是与样本经验测度相关的分布函数,该分布函数是在n个数据点中的每一个上都跳跃1/n的阶梯函数。样本分布函数亦称经验分布函数,统计学中的基本概念之一。

温馨提示

经验分布函数是理论分布函数与实际数据间的桥梁,经验分布函数依概率收敛于总体分布函数,所以,统计推断才得以以样本为依据,而得到合理的结果。而事实上,经验分布函数与总体分布函数还有更进一步的收敛关系

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/11679732.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-17
下一篇 2023-05-17

发表评论

登录后才能评论

评论列表(0条)

保存