一、意义
P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。
二、计算
为理解P值的计算过程,用Z表示检验的统计量,ZC表示根据样本数据计算得到的检验统计量值。
左侧检验 H0:μ≥μ0 vs H1:μ<μ0
P值是当μ=μ0时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值 = P(Z≤ZC|μ=μ0)
右侧检验 H0:μ≤μ0 vs H1:μ>μ0
P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值 = P(Z≥ZC|μ=μ0)
双侧检验 H0:μ=μ0 vs H1:μ≠μ0
P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值 = 2P(Z≥|ZC||μ=μ0)这是一个很重要,但是也是很空洞的问题,希望我以下的分析能让你解开疑惑。
(1)首先说到假设检验,那就要明确原假设H0和备选假设H1
(2)然后建立假设检验的统计量ξ,并建立相应的拒绝域(如果单单是为了得到P值可以省略)
(3)假设H0成立,推导出检验统计量ξ的概率分布函数F(x),或者近似分布函数
(4)根据样本计算检验统计量的具体数值,设为T
(5)判断检验是单边还是双边:
①单边检验的话,直接看F(T)的值,
当F(T)>05, P=F(T)
当F(T)<05, P=1-F(T)
②双边检验的话,
当F(T)>05, P=2F(T)-1
当F(T)<05, P=2F(T)
仔细体会上面的一段话,其实说白了就是“P值是H0允许的最小犯错概率” 。
P值其实就是按照抽样分布计算的一个概率值,这个值是根据检验统计量计算出来的。通过直接比较P值与给定的显著性水平a的大小就可以知道是否拒绝假设,显然这就代替了比较检验统计量的值与临界值的大小的方法。
而且通过这种方法,我们还可以知道在P值小于a的情况下犯第一类错误的实际概率是多少, P= 003< a= 005,那么拒绝假设,这一决策可能犯错误的概率是003。需要指出的是,如果P> a,那么假设不被拒绝,在这种情况下,第一类错误并不会发生。
T检验中的P值是接受两均值存在差异这个假设可能犯错误的概率。例如:如果零假设是两个总体的均值相等(u1= u2),但是从相应的两个样本中所计算出的样本的均值不相等,有一定的“差异”。
如果根据这个“差异”值计算出p< 001,那么就是说,如果零假设是正确的,即两个总体的均值相等,那么在样本的均值之间产生了像本例中这样大的差异的概率小于001。
也就是说,产生像这两个样本均值这样大的差异的原因是随机发生的,而不是由于它们所来自的总体本来的均值就不相等,出现这种差异结果的概率是< 001。
扩展资料
P值的作用:
P值可以用来进行假设检验的决策,如果P值比显著性水平a小,检验统计量的值就是在拒绝域内。同样,如果P值大于或等于显著性水平a,检验统计量的值就不再拒绝域内。在上例咖啡问题中, P值为00038小于显著性水平a=001,说明应该拒绝原假设。
多个样本均数间的两两比较称多重比较,如果用两个样本均数比较的t检验进行多重比较,将会加大犯I类错误的概率。
例如有4个样本,两两组合数为(24)= 6,若用t检验做6次,且每次比较的检验水准选为a=005,则每次比较不犯I类错误的概率为(1- 005)6次均不犯I类错误的概率为(1- 005)6,这是总的检验水准变为1- (1- 005)6= 026,比005大多了。
因此,许多统计学家得出多重比较不适用t检验。所谓不能进行t检验的关键原因是由于检验次数增多从而获得全部检验正确的概率就会下降,即犯I类错误的概率上升了,而不是t检验本身的缺陷。
如果我们做一次新药临床试验的数据分析,在整个分析过程中进行了n次试验,那么根据这个推论,我们整个分析全对的概率可能早就所剩无几了。此时,如果犯I类错误的概率不应该由检验水平a计算,而是按照每次试验得到的P值算得,这样就会得到全部检验结果犯错误的实际概率了。
参考资料来源:百度百科-t检验
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)