Bootstrap 2 利用Bootstrap 计算 p-value

Bootstrap 2 利用Bootstrap 计算 p-value,第1张

本展示如何利用 Bootstrap 来计算均值的 p-value, 同理也可以计算其他统计值。

假设在一次测量中, 得到测量值如下图所示, 均值是05

首先, 我们复习一下 p-value 的定义:

假如Null 假设是正确的, p-value 代表我们看到比当前结果更加极端(违背Null 假设方向)的结果的概率

因此,我们需要先获得一份Null 假设是正确的样本。 在这里, Null 假设是

总体的均值为0

所以, 需要将图中样本的每个测量值, 向左移动 05 个单位 (样本均值), 得到:

然后, 在 Mean=0 的样本上, 对 Mean 进行 Bootstrap 采样, 会的到一个关于均值的分布:

这个分布的意思是:假如总体均值为0 ,利用样本进行Boostrap 的到的均值分布。 为了得到 p-value, 我们可以统计这个分布中, 0值左右,大于样本均值, 和小于样本均值的数据点占比(<-05, >05)。 这正好符合了 p-vlaue “更加极端” 的定义。

在上图中, (<-05, >05)的数据点占比 063, 那么p-value 就是063。

p值(p-value)是概率论和统计学中一个非常重要的概念,通俗地解释,即为对某一事件或假设的检验结果给出的一个概率值。在统计假设检验中,p值通常用于判断样本的统计量是否与某个理论分布一致。当p值很小时,我们可以拒绝原假设,即拒绝样本和理论分布一致的假设,而接受备择假设。而当p值很大时,则无法拒绝原假设。通常情况下,我们会将p值的阈值定为005或001。
p值的计算需要根据检验的具体情况而定。以单样本t检验为例,我们可以通过计算样本的平均值、标准差、样本容量以及假设的参考值,然后根据t分布表查找相应的临界值,最终计算出p值。当然,在实际应用中,我们可以通过使用统计软件来计算p值,并进行假设检验。
总之,p值是检验假设是否成立的重要指标之一,它可以帮助我们确定样本和理论分布是否一致。但是需要注意的是,p值只是一个指标,不能完全代替直觉和经验,需要结合实际情况进行综合分析。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/13069106.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-30
下一篇 2023-05-30

发表评论

登录后才能评论

评论列表(0条)

保存