对于一个样本序列 ,经验累积分布函数 (Empirical Cumulative Distribution Function)可被定义为
其中 是一个指示函数,如果 ,指示函数取值为1,否则取值为0,因此 能反映在样本中小于 的元素数量占比。
根据格利文科定理(Glivenko–Cantelli Theorem),如果一个样本满足独立同分布(IID),那么其经验累积分布函数 会趋近于真实的累积分布函数 。
首先定义一个类,命名为ECDF:
我们采用均匀分布(Uniform)进行验证,导入 uniform 包,然后进行两轮抽样,第一轮抽取10次,第二轮抽取1000次,比较输出的结果。
输出结果为:
而我们知道,在真实的0到1均匀分布中, 时, ,从模拟结果可以看出,样本量越大,最终的经验累积分布函数值也越接近于真实的累积分布函数值,因此格利文科定理得以证明。
样本经验测度。根据查询相关公开信息显示,统计学中,经验分布函数是与样本经验测度相关的分布函数,该分布函数是在n个数据点中的每一个上都跳跃1/n的阶梯函数。样本分布函数亦称经验分布函数,统计学中的基本概念之一。
温馨提示
经验分布函数是理论分布函数与实际数据间的桥梁,经验分布函数依概率收敛于总体分布函数,所以,统计推断才得以以样本为依据,而得到合理的结果。而事实上,经验分布函数与总体分布函数还有更进一步的收敛关系
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)