独立效应t检验
t检验的效应量,我们用Cohen's d表示,简写为d,反映两个均数之间的标准差异:
d=(m1-m2)/s
其中分母是两个独立样本的联合标准差,计算方法为两个样本标准差的平方平均数,即
d=(m1-m2)/根号下[(s1s1+s2-s2)]/2
不过注意了,这是独立样本的计算方法,配对样本中共同标准差采用配对数据差值的标准差即可,不用这一公式。
S是样本标准差,其计算公式为:
置信区间越大,置信水平越高。
参数的置信区间估计的要旨是:充分利用样本所提供的信息,做出尽可能可靠而精确的估计。
扩展资料:
奈曼以概率的频率解释为出发点,认为被估计的θ是一未知但确定的量,而样本X是随机的。区间A(X),B(X)是否真包含待估计的θ,取决于所抽得的样本X。因此,区间 A(X),B(X)只能以一定的概率包含未知的θ。
对于不同的θ,π(θ)之值可以不同,π(θ)对不同的θ取的最小值1-α(0<;α<1)称为区间A(X),B(X)的置信系数。与此相应,区间A(X),B(X)称为θ的一个置信区间。
这个名词在直观上可以理解为:对于“区间A(X),B(X)包含θ”这个推断,可以给予一定程度的相信,其程度则由置信系数表示。
Q检验法
Q检验法又叫做舍弃商法,是迪克森(W.J.Dixon)在1951年专为分析化学中少量观测次数(n<10)提出的一种简易判据式。
按以下步骤来确定可疑值的取舍:
(1)将各数据按递增顺数排列:X1,X2,X3,…,Xn-1,Xn。
(2)求出最大值与最小值的差值(极差)Xmax-Xmin
(3)求出可疑值与其最相邻数据之间的差值的绝对值。
(4)求出Q(Q等于(3)中的差值除以(2)中的极差)。
(5)根据测定次数n和要求的置信水平(如95%)查表(见下)得到值
(6)判断:若计算Q>Q表,则舍去可疑值,否则应予保留。
F检验法
F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差S2,以确定他们的精密度是否有显著性差异。至于两组数据之间是否存在系统误差,则在进行F检验并确定它们的精密度没有显著性差异之后,再进行t 检验。
样本标准偏差的平方,即:
两组数据就能得到两个S²值,
由表中f大和f小(f为自由度n-1),查得F表,
然后计算的F值与查表得到的F表值比较,如果
F < F表 表明两组数据没有显著差异;
F ≥ F表 表明两组数据存在显著差异。
T检验法
T检验法,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。
t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与f检验、卡方检验并列。t检验是戈斯特为了观测酿酒质量而发明的。戈斯特在位于都柏林的健力士酿酒厂担任统计学家,基于Claude Guinness聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政策。戈斯特于1908年在Biometrika上公布t检验,但因其老板认为其为商业机密而被迫使用笔名(学生)。实际上,跟他合作过的统计学家是知道“学生”的真实身份是戈斯特的。
T检验是用于两个样本(或样本与群体)平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。T检验的适用条件为样本分布符合正态分布 。
T检验的应用条件:
1) 当样本例数较小时,要求样本取自正态总体;
2)做两样本均数比较时,还要求两样本的总体方差相
等。
T检验的用途 :(1)样本均数与群体均数的比较;(2)两样本均数的比较。
假设检验可以分为三步:
(1)建立检验假设和确定检验水准;
(2)选定检验方法和计算检验统计量;
(3)确定P值和做出推断结论。
检验假设 是针对总体特征而言,包括相互对立的两个方面,即两种假设:
一种是无效假设或称原假设、零假设,符号为H0,它是要否定的假设;
另一种是备择假设,记为H1,它是H0的对立面。
二者是从反证法的思想提出的, H1和H0是相互联系、又相互对立的假设。
假设检验还需根据不同研究目的事先设置是否拒绝原假设的判断标准,即检验水准。 检验水准 也称显著性水准,它指无效假设H0为真,但被错误地拒绝的一个小概率值,一般取检验水准α =005。
要根据研究设计的类型和统计推断的目的选用不同的检验方法。如成组设计的两样本均数的比较用t检验,多个样本均数的比较用F检验。
检验统计量是用于抉择是否拒绝H0的统计量(因此在我们确定检验假设H0,H1时,检验方法和检验统计量就已经确定了),其统计分布在统计推断中是至关重要的,不同的检验方法要用不同的方式计算现有样本的检验统计量值。
这里的P值是指由H0成立时的检验统计量出现在由样本计算出来的检验统计量的末端或更末端处的概率值。
当P≤ α时,结论为按所取检验水准拒绝H0,接受H1,这样做出结论的理由是:在H0成立的条件下,出现等于及大于现有检验统计量值的概率P≤ α ,是小概率事件,这在一次抽样中是不大可能发生的,即现有样本信息不支持H0因而拒绝它;若P>α,即样本信息支持H0,就没有理由拒绝它,此时只好接受它。
大量检测已知正常人血浆载脂蛋白E( apo E)总体平均水平为415mmol/L。某医师经抽样测得41例陈旧性心机梗死患者的血浆载脂蛋白E平均浓度为522mmol/L,标准差为161mmol/L。据此能否认为陈旧性心肌梗死患者的血浆载脂蛋白E平均浓度与正常人的平均浓度不一致?
(1)建立检验假设和确定检验水准。H0: μ=μ0,H1: μ≠μ0,α=005,双侧检验;
(2)选定检验方法和计算统计量。用单样本的t检验,
(3) 确定P值和作出推断结论。查t分布表, t005/2,40=2021, t=426>t005/2,40,P<005。按α=005水准,拒绝H0,接受H1,可认为陈旧性心肌梗死患者的血浆载脂蛋白E平均浓度与正常人的差别有统计学意义,结合专业可以认为前者平均浓度较高。
(1)建立检验假设和确定检验水准。H0: μd=0,H1: μd≠0,α=005,双侧检验;
(2)选定检验方法和计算统计量。
(3) 确定P值和作出推断结论。查t分布表(双侧), t=42>t 005/2, 7 =2365,P<005。按 α= 005水准,拒绝H0,接受H1,可以认为两种饲料喂养的两组大白鼠中维生素A的含量有差别。正常饲料组比缺乏维生素E饲料组的含量要高。
t检验有多种类型,可以分为只有一组样本的单体检验和有两组样本的双体检验。单体检验用于检验样本的分布期望是否等于某个值。双体检验用于检验两组样本的分布期望是否相等,又分为配对双体检验和非配对双体检验。配对双体检验的两组样本数据是一一对应的,而非配对双体检验的两组数据则是独立的。比如药物实验中,配对双体检验适用于观察同一组人服用药物之前和之后,非配对双体检验适用于一组服用药物而一组不服用药物。
1、单体检验
单体检验是针对一组样本的假设检验。零假设为H0: μ=μ0。统计量服从自由度为n-1的 T 分布。
2、配对双体检验
配对双体检验针对配对的两组样本。配对双体检验假设两组样本之间的差值服从正态分布。如果该正态分布的期望为零,则说明这两组样本不存在显著差异。零假设为 H0:μ=μ0,统计量服从n-1的T分布,其中d是差值的平均值,s是差值的样本标准差。
3、非配对双体检验
非配对双体检验针对独立的两组样本。非配对双体检验假设两组样本是从不同的正态分布采样出来的。根据两个正态分布的标准差是否相等,非配对双体检验又可以分两类。一种是分布标准差 相等 的情况。零假设是两组样本的分布期望相等,统计量 T 服从自由度为 n1+n2-2的T分布。
其中x1和x2分别是两组样本的平均值,n1和n2分别是两组样本的大小,s1和s2分别是两组样本的样本标准差。
另一种是 分布标准差不相等 的情况。零假设也是两组样本的分布期望相等,统计量 T 服从 T 分布。
思考
由于每次抽样的样本平均值都是围绕着群体期望值分布,因此我们认为只要某次抽样平均值在接受零假设的区间内,我们便接受零假设。t检验过程,是对两样本均数(mean)差别的显著性进行检验。惟t检验须知道两个总体的方差(Variances)是否相等;t检验值的计算会因方差是否相等而有所不同。也就是说,t检验须视乎方差齐性(Equality of Variances)结果。所以,SPSS在进行t-test for Equality of Means的同时,也要做Levene's Test for Equality of Variances 。
1
在Levene's Test for Equality of Variances一栏中 F值为236, Sig为128,表示方差齐性检验「没有显著差异」,即两方差齐(Equal Variances),故下面t检验的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结果。
2
在t-test for Equality of Means中,第一排(Variances=Equal)的情况:t=8892, df=84, 2-Tail Sig=000, Mean Difference=2299
既然Sig=000,亦即,两样本均数差别有显著性意义!
3
到底看哪个Levene's Test for Equality of Variances一栏中sig,还是看t-test for Equality of Means中那个Sig (2-tailed)啊
答案是:两个都要看。
先看Levene's Test for Equality of Variances,如果方差齐性检验「没有显著差异」,即两方差齐(Equal Variances),故接著的t检验的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结果。
反之,如果方差齐性检验「有显著差异」,即两方差不齐(Unequal Variances),故接著的t检验的结果表中要看第二排的数据,亦即方差不齐的情况下的t检验的结果。
4
你做的是T检验,为什么会有F值呢
就是因为要评估两个总体的方差(Variances)是否相等,要做Levene's Test for Equality of Variances,要检验方差,故所以就有F值。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)