在 SPSS 中,虽然提供了很多的模型与方法供数据分析使用,但其中很多都需要满足正态性或方差齐性假设,如果我们忽视这一前提假设(虽然某些模型有一定耐受性),直接进行 SPSS 分析会大大增加犯两类错误的概率,显然得出的结论是不可靠的。
下面分别介绍 SPSS 关于样本数据正态性与方差齐性检验方法。
一、正态性检验
图示法
1直方图。是否以钟形分布,还可以选择输出正态性曲线;
2PP图和QQ图。如果样本数据对应的总体分布确为正态分布,则样本数据对应的散点应基本落在原点出发的45°线附近;
3茎叶图。茎叶图的用途同直方图,它不仅具备与直方图相同的直观性,同时能精细表达样本数据的取值水平,当样本量小时,可以通过茎叶图进行正态性呈现;
4正态分位图。数据集中在直线附近,数据不超出95%置信区间线即可说明数据呈正态分布。
注:图示法清晰直观,作为初步判断很有效,但为增加可信度还需要统计指示方法的检验
统计指示法
1偏度和峰度。正态分布的偏度系数为0,峰度系数为3。
2偏度峰度联合检验法(Jarque-Bera)。如果样本数据所来自的总体服从正态分布,则JB近似服从自由度为2的卡方分布。
Jarque-Bera检验相比于其他检验方法更容易成功地接受正态性假定,即Ⅰ类错误风险较低。Jarque-Bera检验不能用于小样本检验
3Shapiro-Wilk检验。一般来说,可以使用Shapiro-Wilk检验判断数据的正态分布情况。如果数据接近正态分布,那么Shapiro-Wilk检验的P值就大于005;反之则小于005
适用于3 < 样本数< 5000 时的正态性检验,计算可得到一个相关系数,它越接近 1 就越表明数据和正态分布拟合得越好
4Kolmogorov-Smirnor检验(KS)。其检验的是标化后的数据是否服从理论的分布。需要注意的是样本数据如果有结点(即是重复的数据),则无法计算准确的P值,需要先对结点处理
非参数检验KS检验基于经验分布函数,该检验适用大样本(N>2000)。
SPSS中有两个地方可以做K-S检验,一处在“分析(Analyze) >> 非参数检验(Nonparametric tests)>>单样本(One sample)”,另一处在“分析(Analyze)>>描述统计量(Descriptive Statistics)>>探索(Explore)”中。两者的检验方法不同,检验结果可能也会有差异。单样本检验是将变量的观察累积分布函数与指定的理论分布进行比较,该理论分布可以是正态分布、均匀分布、泊松分布或指数分布,是一种拟合优度检验,检验效率较低。Explore中的K-S和W检验是用一个综合指标来反映材料的正态性,资料的正态峰和对称峰两个特征有一个不满足正态性要求时,假阴性较大。单样本K-S检验统计量为Z,Explore分析中的K-S检验统计量为D。
5Lilliefors检验(K-S检验的修正)。对KS正态性检验的的修正,适合大样本。适用于一般的正态性检验。
MINITAB软件在6sigma黑带培训中的应用,六西格玛是一种基于数据的决策方法。为了确保数据的真实有效及对数据的深人分析, 六西格玛管理中D-M-A-I-C的各个阶段都句许多数据分析工具供选用。这些工具有的较为简单,像柏拉图、因果分析等;有些工具则比较复杂,像方差分析、回归分析、试验设计、测量系统分析等。如果手工做这些分析计算,往往工作量巨大,切费时又费力,结果误差也比较大,由于手工计算的复杂性和繁琐,导致许多小公司认为六西格玛是十分复杂的东西,是一流大公司才有条件使用的,小公司无条件推行六西格玛管理法。如果能有一种统计软件来解决以上问题,则六西格玛管理法的应用将会得到孙素普及。
M I N IT A B 的出现完美地解决了以上难题。minitab是由minitab公司设计的一套数据处理软件,它强大的数据处理功能完全能满足六西恪玛管理各个阶段的数据处理要求。目前.包括MOTOROLA、GE在内的99%的推行六西格玛管理的公司都在使用minitab 软件, minitab的两大核心功能为进行数据的统计分新和图形分析, 下面作简单的说明。
一、数据分析
minitab的核心功能之一, 是进行数据分析处理,其基本数据分析功能涵盖以下方面:
1 基本统计。
包括进行基本描述统计、置信区i可分析、相关性分析、正态性检验等。
2 回归分析。
包括进行一般回归分析、逐步回归分析、后勤回归分析等,并可绘制残差图。
3 方差分析。
包括进行单因素、多因素为差分析等,并可绘制交互作用图,主要影响图和进行方差齐性检验。
4 试验设计分析。
包括进行分部因子、全困子、响应表面、混合、田口试验设计的试验表设计及试验结果分析。
5 控制图。
包括各类计量值及计数值控制图。
6 质量工具。
包括柏拉图、因果图、正态数据过程能力分析、非正态数据过程能力分析、计数值及计量值数据测量系统分析等。
7 可靠性工具。
包括数据分布类别检验、可靠性分析、加速寿命测试、衰减分析等。
8 多变量分析。
包括主要因素分析、因子分析、判断式分析等。
9 时间序列分析。
包括时间序列图、分解分析、移动平均、指数平滑分析,相关等
10 表格分析。
包括交叉表、卡方测试、自相关分析等。
11 非参数测试。
包括单样本标记测试、单样本置信区问标记测试等。
二、图形分析
图示数据是一种常见的数据分析为法,比起冗长的计算和枯燥的数据, 图形分析有简单、亘观的优点,因而图形分析结合数据分析, 形成了六西格玛方法的鲜明特点。MINITAB有丰富的图形分析功能,主要图形功能如下
( l ) 直方图。
{ 2 ) 散布图。
( 3 ) 时间序列图。
( 4) 条形图。
( 5) 箱图
( 6 ) 矩阵图
( 7) 轮廓图。
2位粉丝请教:如何判断是几阶自相关
DW一般只能检验一阶自相关,如果要检验多阶自相关,可以看相关图和Q统计量,以及LM检验。 EVIEWS *** 作里面主要是在VIEW/Residual Tests里面的一些选项,因为自相关是残差自相关。 如果需要判断几阶,看自相关系数和偏自相关系数。 再补充一下,自相关模型主要是AR(q)模型,q代表你所需要的阶数,可以看AC和PAC来判断。 自相关系数(AC)和偏自相关系数(PAC)有一个相关图,在view/correlogram里,这个时候,可以看两边虚线之间的位置,如果超过了虚线,一般说明存在自相关,反之在虚线以内就不存在,从上往下一阶二阶三阶等。 但这时候存在一个问题,AR(q)中的q是看AC还是看PAC,我们问过老师,说计量其实是一种经验的积累,从他的经验看,一般q取到3就差不多了。 不知道分析的对不对,但做模型其实就是个不断调整的过程,取最好的那个结果。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)