统计P值是什么,怎么算?

统计P值是什么,怎么算?,第1张

P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。

总之,P值越小,表明结果越显著。但是检验的结果究竟是“显著的”、“中度显著的”还是“高度显著的”需要我们自己根据P值的大小和实际问题来解决。

计算:

为理解P值的计算过程,用Z表示检验的统计量,ZC表示根据样本数据计算得到的检验统计量值。

1、左侧检验

P值是当

时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值

2、右侧检验

P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值

3、双侧检验

P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值

扩展资料

美国统计协会公布了P值使用的几大准则:

准则1:P值可以表达的是数据与一个给定模型不匹配的程度

这条准则的意思是说,我们通常会设立一个假设的模型,称为“原假设”,然后在这个模型下观察数据在多大程度上与原假设背道而驰。P值越小,说明数据与模型之间越不匹配。

准则2:P值并不能衡量某条假设为真的概率,或是数据仅由随机因素产生的概率。

这条准则表明,尽管研究者们在很多情况下都希望计算出某假设为真的概率,但P值的作用并不是这个。P值只解释数据与假设之间的关系,它并不解释假设本身。

准则3:科学结论、商业决策或政策制定不应该仅依赖于P值是否超过一个给定的阈值。

这一条给出了对决策制定的建议:成功的决策取决于很多方面,包括实验的设计,测量的质量,外部的信息和证据,假设的合理性等等。仅仅看P值是否小于005是非常具有误导性的。

准则4:合理的推断过程需要完整的报告和透明度。

这条准则强调,在给出统计分析的结果时,不能有选择地给出P值和相关分析。举个例子来说,某项研究可能使用了好几种分析的方法。

而研究者只报告P值最小的那项,这就会使得P值无法进行解释。相应地,声明建议研究者应该给出研究过程中检验过的假设的数量,所有使用过的方法和相应的P值等。

准则5:P值或统计显著性并不衡量影响的大小或结果的重要性。

这句话说明,统计的显著性并不代表科学上的重要性。一个经常会看到的现象是,无论某个效应的影响有多小,当样本量足够大或测量精度足够高时,P值通常都会很小。反之,一些重大的影响如果样本量不够多或测量精度不够高,其P值也可能很大。

准则6:P值就其本身而言,并不是一个非常好的对模型或假设所含证据大小的衡量。

简而言之,数据分析不能仅仅计算P值,而应该探索其他更贴近数据的模型。

声明之后还列举出了一些其他的能对P值进行补充的分析方手段,比如置信区间,贝叶斯方法,似然比,FDR(False Discovery Rate)等等。这些方法都依赖于一些其他的假定,但在一些特定的问题中会比P值更为直接地回答诸如“哪个假定更为正确”这样的问题。

声明最后给出了对统计实践者的一些建议:好的科学实践包括方方面面,如好的设计和实施,数值上和图形上对数据进行汇总,对研究中现象的理解,对结果的解释,完整的报告等等——科学的世界里,不存在哪个单一的指标能替代科学的思维方式。

参考资料来源:百度百科-P值

假设第一组野生型的患病率是p1,第二组是p2
所以你的原假设就是p1=p2
枢轴变量T
=
(实际比例1-实际比例2)/根号(方差1+方差2)
~
N(0,1)
标准正态分布
实际比例1=36/185
实际比例2=12/65
方差1=实际比例1×(1-实际比例1)/n1=36/185×149/185×1/185=00008471
方差2=实际比例2×(1-实际比例2)/n2=12/65×53/65×1/65=0002316
T=01774
查正态分布表得到P值是:2×(1-05675)=08650
没有差异,完全没有差异
为何×2?因为你的原假设是p1=p2
是双侧检验

统计学中,P值是用来判定假设检验结果的一个参数。

如果P值很小,说明原假设情况的发生的概率很小,且P值越小,表明结果越显著。

为理解P值的计算过程,用Z表示检验的统计量,ZC表示根据样本数据计算得到的检验统计量值。

左侧检验 H0:μ≥μ0 vs H1:μ<μ0

P值是当μ=μ0时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值 = P(ZC≤Z|μ=μ0)

右侧检验 H0:μ≤μ0 vs H1:μ>μ0

P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值 = P(ZC≥Z|μ=μ0)

双侧检验 H0:μ=μ0 vs H1:μ≠μ0

P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值 = 2P(ZC≥|Z||μ=μ0)

扩展资料:

t检验主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。T检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与f检验、卡方检验并列。

单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布。

双总体t检验又分为两种情况,一是独立样本t检验(各实验处理组之间毫无相关存在,即为独立样本),该检验用于检验两组非相关样本被试所获得的数据的差异性;一是配对样本t检验,用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。

参考资料来源:百度百科--t检验

结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法
P值的计算公式是
=2[1-Φ(z0)] 当被测假设H1为 p不等于p0时;
=1-Φ(z0) 当被测假设H1为 p大于p0时;
=Φ(z0) 当被测假设H1为 p小于p0时;
其中,Φ(z0)要查表得到
z0=(x-np0)/(根号下(np0(1-p0)))
最后,当P值小于某个显著参数的时候(常用005,标记为α,给你出题那个人,可能混淆了这两个概念)我们就可以否定假设反之,则不能否定假设
注意,这里p0是那个缺少的假设满意度,而不是要求的P值
没有p0就形不成假设检验,也就不存在P值
热心网友 | 2013-04-16
1
0
统计学意义(p值)ZT
结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标p值是将观察结果认为有效即具有总体代表性的犯错概率如p=005提示样本中变量关联有5%的可能是由于偶然性造成的即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关)在许多研究领域,005的p值通常被认为是可接受错误的边界水平
在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性换句话说,认为结果无效而被拒绝接受的水平的选择具有武断性实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两>比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例通常,许多的科学领域中产生p值的结 果≤005被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性结果005≥p>001被认为是具有统计学意义,而001≥p≥0001被认为具有高度统计学意义但要注意这种分类仅仅是研究基础上非正规的判断常规
所有的检验统计都是正态分布的吗并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、f检验或卡方检验这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态

P值的计算公式:

=2[1-Φ(z0)] 当被测假设H1为 p不等于p0时;

=1-Φ(z0) 当被测假设H1为 p大于p0时;

=Φ(z0) 当被测假设H1为 p小于p0时;

其中,Φ(z0)要查表得到。

z0=(x-np0)/(根号下(np0(1-p0)))

最后,当P值小于某个显著参数的时候我们就可以否定假设。反之,则不能否定假设。

实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和的总和表示,记作SSb,组间自由度dfb。

扩展资料:

如测量误差造成的差异或个体间的差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示, 记作SSw,组内自由度dfw。

总偏差平方和 SSt = SSb + SSw。

组内SSw、组间SSb除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MSw和MSb,一种情况是处理没有作用,即各组样本均来自同一总体,MSb/MSw≈1。

另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,MSb>>MSw(远远大于)。

当控制变量为定序变量时,趋势检验能够分析随着控制变量水平的变化,观测变量值变化的总体趋势是怎样的,是呈现线性变化趋势,还是呈二次、三次等多项式变化。通过趋势检验,能够帮助人们从另一个角度把握控制变量不同水平对观测变量总体作用的程度。

参考资料来源:百度百科——方差分析


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/yw/12674184.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-27
下一篇 2023-05-27

发表评论

登录后才能评论

评论列表(0条)

保存