统计中t检验法中P值该怎样计算

统计中t检验法中P值该怎样计算,第1张

P值其实就是按照抽样分布计算的一个概率值,这个值是根据检验统计量计算出来的。通过直接比较P值与给定的显著性水平a的大小就可以知道是否拒绝假设,显然这就代替了比较检验统计量的值与临界值的大小的方法。

而且通过这种方法,我们还可以知道在P值小于a的情况下犯第一类错误的实际概率是多少, P= 003< a= 005,那么拒绝假设,这一决策可能犯错误的概率是003。需要指出的是,如果P> a,那么假设不被拒绝,在这种情况下,第一类错误并不会发生。

T检验中的P值是接受两均值存在差异这个假设可能犯错误的概率。例如:如果零假设是两个总体的均值相等(u1= u2),但是从相应的两个样本中所计算出的样本的均值不相等,有一定的“差异”。

如果根据这个“差异”值计算出p< 001,那么就是说,如果零假设是正确的,即两个总体的均值相等,那么在样本的均值之间产生了像本例中这样大的差异的概率小于001。

也就是说,产生像这两个样本均值这样大的差异的原因是随机发生的,而不是由于它们所来自的总体本来的均值就不相等,出现这种差异结果的概率是< 001。

扩展资料

P值的作用:

P值可以用来进行假设检验的决策,如果P值比显著性水平a小,检验统计量的值就是在拒绝域内。同样,如果P值大于或等于显著性水平a,检验统计量的值就不再拒绝域内。在上例咖啡问题中, P值为00038小于显著性水平a=001,说明应该拒绝原假设。

多个样本均数间的两两比较称多重比较,如果用两个样本均数比较的t检验进行多重比较,将会加大犯I类错误的概率。

例如有4个样本,两两组合数为(24)= 6,若用t检验做6次,且每次比较的检验水准选为a=005,则每次比较不犯I类错误的概率为(1- 005)6次均不犯I类错误的概率为(1- 005)6,这是总的检验水准变为1- (1- 005)6= 026,比005大多了。

因此,许多统计学家得出多重比较不适用t检验。所谓不能进行t检验的关键原因是由于检验次数增多从而获得全部检验正确的概率就会下降,即犯I类错误的概率上升了,而不是t检验本身的缺陷。

如果我们做一次新药临床试验的数据分析,在整个分析过程中进行了n次试验,那么根据这个推论,我们整个分析全对的概率可能早就所剩无几了。此时,如果犯I类错误的概率不应该由检验水平a计算,而是按照每次试验得到的P值算得,这样就会得到全部检验结果犯错误的实际概率了。

参考资料来源:百度百科-t检验

原假设是没有发生变化。
若你的计算过程正确,得到的x^2=14,自由度是df=k-1=4,那么p值就是p(C>=14),其中C是服从自由度为df的卡方分布的随机变量。
用EXCEL计算,用公式‘’=CHISQDISTRT(14,4)‘,得到概率值为0007295,即为所求p值。
用R计算:pchisq(14,4,lowertail=FALSE),也能得到同样的结果。
p值小于01,因此,拒绝原假设,即在01的显著性水平下,认为现在的情况与经验数据相比发生了变化。

标准正态分布表(Z值表)计算:

NORMSINV(1-α/2)双侧,例如:NORMSINV(1-005/2)=1959963985

NORMSINV(1-α)单侧,例如:NORMSINV(1-005)=1644853627

P值的计算:

双侧:P值=(1-NORMSDIST(Z值))2,例如:(1-NORMSDIST(196))2=00249978952=005

单侧:P值=1-NORMSDIST(Z值),例如:1-NORMSDIST(196)=0024997895=0025

Zα称为标准正态分布的临界值,t(α,n-1)称为t分布(student分布)的临界值,这两个值可以通过查统计学教科书附表而取得。

参数含义:

正态分布具有两个参数μ和σ^2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ^2是此随机变量的方差,所以正态分布记作N(μ,σ2)。

μ是正态分布的位置参数,描述正态分布的集中趋势位置。概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小。正态分布以X=μ为对称轴,左右完全对称。正态分布的期望、均数、中位数、众数相同,均等于μ。

百度百科-正态分布

F值时F检验的统计量值,F=MSR/MSE,其中MSR=SSR/自由度,MSE=SST/自由度,一般大于给定阿尔法相对的F量时说明显著
P值是指(F检验或者T或者其余检验量)大于所求值时的概率,一般要小于于给定α就说明检验显著p=P(|U|>=|u|)=|uα/2|)=α
r值是拟合优度指数,用来评价模型的拟合好坏等,取值范围是-1,1,越接近正负1越好R平方=SSR/SST其中SSR是回归平方和,SST是总离差平方和

P值指的是比较的两者的差别是由机遇所致的可能性大小。P值越小,越有理由认为对比事物间存在差异。例如,P<005,就是说结果显示的差别是由机遇所致的可能性不足5%,或者说,别人在同样的条件下重复同样的研究,得出相反结论的可能性不足5%。

P>005称“不显著”;P<=005称“显著”,P<=001称“非常显著”。

用 HR 来比较两组患者的生存情况具有以下优势:

1、在某些研究中,研究结束时试验组或对照组可能有 50% 以上的患者仍未发生终点事件或删失,在此种情况下中位生存时间无法获得;

2、生存数据常常服从偏态分布,仅用中位生存时间来代表生存数据整体的分布状态比较片面;

3、通过中位生存时间相减来比较两组患者的生存情况,无法对基线时不平衡的协变量进行调整,得到的效应估计值受到混杂因素的影响,而使用 HR 则可通过多变量 Cox 模型调整混杂因素的影响,得到无偏的效应估计值。

扩展资料:

统计学是研究数据的收集、整理、分析的一门科学。它的原理几乎应用到自然科学和社会科学的各个领域,也相应地产生了许多应用性分支,医学统计学就是其中之一。它是以医学理论为指导,借助于统计学的原理和方法,研究医学现象中数据的收集、整理、分析的一门应用性学科。

合理的统计分析能够帮助我们揭示事物或现象发生和发展的规律,阐明我们所关心的问题,如哪些因素对人群健康状况影响较大,某种疾病的可疑病因是什么,哪些指标可以用来筛选高危人群或早期诊断疾病,哪种治疗方法的有效率高,哪些是保护和促进人群健康的因素等等。医学统计方法很多,本篇着重讨论常用的医学统计方法。

参考资料来源:百度百科-医学统计


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/yw/12993939.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-29
下一篇 2023-05-29

发表评论

登录后才能评论

评论列表(0条)

保存