假设检验的一般步骤:
(一)根据所研究问题的要求,提出原假设 和备择假设 。
有三种类型的原假设和备择假设,以总体均值的假设检验为例加以说明。
1 : ; :
2 : ; :
3 : ; :
其中,1 是双侧假设检验;2 是右侧假设检验;3 是左侧假设检验。因为假设检验是根据概率意义下的反证法来否定原假设,所以原假设必须包含等号。究竟采用哪一种检验要视具体问题而定,尤其是选择右侧检验还是左侧检验时,更要慎重。
(二)找出检验的统计量及其分布。
与参数估计一样,假设检验也要根据样本数据进行统计推断。用于判断是否接受原假设 的统计量称为检验统计量。在实际应用时,检验统计量的选择及其分布要根据检验的具体内容、抽样的方式、样本容量的大小和总体方差是否已知等多种因素来确定,常用的检验统计量有 统计量、 统计量、 统计量及 统计量等。
(三)规定显著性水平 ,就是选择发生第一类错误的最大允许概率。
显著性水平 的大小,取决于发生第一类错误和第二类错误产生的后果。如果 取的较小,那么 将会较大,虽然否定一个真实原假设(弃真)的风险小了,其代价是增加了接受一个不真实原假设(取伪)的概率;反之,如果 取的较大,那么 将会较小,虽然接受一个不真实原假设(取伪)的的风险小了,其代价是增加了否定一个真实原假设(弃真)的概率。因此,要根据研究问题的需要选择一个合适的 ,通常 选为 、 或 等。
(四)确定决策规则。
在选择好检验统计量和规定了显著性水平后,就可以根据
求出否定原假设和接受原假设的临界值,从而也就确定了否定域 。
(五)计算检验统计量的值,作出统计决策。
如果检验统计量的值落在否定域 里,则否定 ;否则,不否定 。
需要说明的是,显著性检验只对发生第一类错误的概率进行了控制,而不对发生第二类错误的概率加以限制。因此,当我们决定接受 时,并不意味着 一定为真,因为我们不能确定该决策有多大的可靠性。确切的说法是:在显著性水平为 时,根据这次试验得到的样本数据,不足以否定 。鉴于发生第二类错误的不确定性,通常在做决策时,统计学家建议我们采用“不否定 或不拒绝 ”的说法,而不采用“接受 ” 的说法。但是,要否定 ,只要一个反例就足够了。否定了 ,也就避免了第二类错误,所以根据样本数据,作出否定 的决策就具有了可靠性。检验统计量简单来说就是用来决定是否可以拒绝原假设的证据检验统计量的值是利用样本数据计算得到的,它代表了样本中的信息检验统计量的绝对值越大,拒绝原假设的理由越充分,反之,不拒绝原假设的理由越充分
方法/步骤
1、首先,打开或者是新建一组数据,这里是打开一组案例分析中的数据进行分析。
2、在浏览窗口中找到需要分析的数据。
3、选择分析,描述统计中的比率,单击打开。
4、d出一个设置窗口,我们再这里设置比率的分子和分母还有分组变量。
分子和分母分别表示比率变量中的分子和分母变量。
分组变量一般是叙事变量,使用数值代码或者是字符串对分组变量进行编码。
5、这是根据数据中的变量设置的三个分值。
6、下面是对统计量进行设置分析。
打开统计量窗口,里面有四大块,根据数据统计分析自定义设置,设置完成之后确定即可。
7、下面是根据数据分析设置的显示结果,如下图所示:
这是一个很重要,但是也是很空洞的问题,希望我以下的分析能让你解开疑惑。(1)首先说到假设检验,那就要明确原假设H0和备选假设H1
(2)然后建立假设检验的统计量ξ,并建立相应的拒绝域(如果单单是为了得到P值可以省略)
(3)假设H0成立,推导出检验统计量ξ应该具有的概率分布函数F(x),或者近似分布函数
(4)根据样本计算检验统计量的具体数值,设为T
(5)判断检验是单边还是双边:
①单边检验的话,直接看F(T)的值,
当F(T)>05, P=F(T)
当F(T)<05, P=1-F(T)
②双边检验的话,
当F(T)>05, P=2F(T)-1
当F(T)<05, P=2F(T)
仔细体会上面的一段话,其实说白了就是“P值是H0允许的最小犯错概率” 。假设检验一般分为五个步骤:
①建立假设:包括:H0,称无效假设;H1:称备择假设;
②确定检验水准:检验水准用α表示,α一般取005;
③计算检验统计量:根据不同的检验方法,使用特定的公式计算;
④确定P值:通过统计量及相应的界值表来确定P值;
⑤推断结论:如P>α,则接受H0,差别无统计学意义;如P≤α,则拒绝H0,差别有统计学意义。统计量是统计理论中用来对数据进行分析、检验的变量。
宏观量是大量微观量的统计平均值,具有统计平均的意义,对于单个微观粒子,宏观量是没有意义的.相对于微观量的统计平均性质的宏观量也叫统计量.需要指出的是,描写宏观世界的物理量例如速度、动能等实际上也可以说是宏观量,但宏观量并不都具有统计平均的性质,因而宏观量并不都是统计量.
数理统计的基本概念。指不含未知参数的样本函数。如样本x1,x2,…,xn的算术平均数(样本均值)=1n(x1+x2+…+xn)就是一个统计量。从样本构造统计量,实际上是对样本所含总体的信息提炼加工;根据不同的推断要求,可以构造不同的统计量。
统计量有众数,平均数,中位数等等
评价估计量好坏的标准
1) 无偏性。无偏性是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为θ,所选择的估计量为 θˆ,如果E( θˆ)= θ,称 θˆ 为 θ 的无偏估计量。
(2) 有效性。一个无偏的估计量并不意味着它就非常接近被估计的参数,它还必须与总体参数的离散程度比较小。假定有两个用于估计总体参数的无偏估计量,分别用m1和m2 表示,它们的抽样分布的方差分别用 D(m1 )和D(m2 )表示,如果 m1的方差小于m2 的方差,即D(m1)< D(m2 ),我们就称m1是比m2更有效的一个估计量。在无偏估计的条件下,估计量方差越小估计也就越有效。 (3)一致性,是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)