如何利用SPSS进行数据的集中趋势与离散程度分析_安全

集中趋势可以看平均值和中位数；以及离散程度可以看标准差，标准差比如为1，平均值为4，说明数据沿着平均值周围波动25%（1/4），这个挺简单的，但是软件帮你计算才行，手工算太麻烦了。建议你可以使用在线SPSS分析软件进行分析，SPSSAU里面有智能化文字分析这些，非常傻瓜简单。

1、打开SPSS软件后点击右上角的打开文件按钮打开你需要分析的数据文件。
2、接下来就是开始做回归分析建立模型，研究其变化趋势，因为回归分析分为线性回归和非线性回归，分析它们的办法是不同的，所以先要把握它们的变化趋势，可以画散点图，点击图形---旧对话框---散点/点状。
3、选择简单分布，并点击定义，这种散点图是我们常见的，而其他几种都比较复杂，用到这儿就把简单问题复杂化了。
4、在接下来的d出框中设置x轴和y轴，然后点击确定，其他都不要管，然后得到散点图，可以看出x轴和y轴明显呈线性关系，所以接下来的回归分析就要用线性回归方法，假设图像呈曲线就需要选择曲线拟合的方法。
5、点击分析---回归---线性，在d出的线性回归框中设置自变量和因变量，其他的选项用默认设置即可，其他的选项只是用来更加精确地去优化模型。
6、接下来就是结果分析了，一共在输出文档中d出了四张表其中系数表就是所求出来的模型，根据B列写出函数表达式，这道题就是y=1594x+26659，sig均小于005表示自变量对因变量有显著影响。
7、Anova表表示分析结果，主要看的是F和Sig值，F值对应的Sig值小于005就可以认为回归方程是有用的，模型汇总表中R表示拟合优度，值越接近1表示模型越好。

近日又有不少盟友咨询说看到文献中率的比较用了Cochran–Armitage trend tests，纷纷问我这是什么高大上的统计方法，其实这就是我们常说的趋势卡方检验，并不是什么高大上的新方法。当处理有序分类变量时，我们常会使用到趋势卡方检验与秩和检验，那么两者使用的区别在哪里呢，使不少盟友产生疑惑，以下是统一解答与回复。
02
使用情况
当“分析变量”（列变量）是有序多分类变量时，分组变量（行变量）不是有序多分类变量时，例如当比较2种手术方式的治疗效果时，“非常差，差，一般，好，非常好”，这时的疗效评价就是分析变量，手术方式是分组变量，这个时候需要用秩和检验，结果如果有差异，看平均秩次，平均秩次越大，疗效越好。
当“分组变量”（行变量）是有序多分类变量时，分析变量（列变量）不是有序多分类变量时，比如，不同年龄段（20-，30-，40-，50-，）的疾病患病率情况，这个时候不同年龄段是分组变量，为有序多分类变量，分析变量是患病与否，可以用卡方检验，如果卡方检验有统计学差异，再看下面的卡方趋势检验结果，有差异说明随着年龄段的增加，患病率越来越高或越低。
03
举例分析
例1：三种手术方式的治疗效果资料列于表1，试问三组手术方式间疗效是否有差别？
表1 三种手术方式间疗效统计
手术方式
疗效
合计
无效
好转
治愈
A
5
32
20
57
B
30
18
10
78
C
15
10
10
35
合计
50
80
40
170
分析：显然此例手术方式为无序分类的分组变量，疗效为有序分类的分析变量，应采用秩和非参检验进行分析，SAS代码如下：
data zhihe1;
do R=1 to 3;
do C=1 to 3;
input F@@;
do i=1 to F;
output;
end;
end;
end;
cards;
5 32 20
30 18 10
15 10 10
;
run;
proc npar1way wilcoxon data=zhihe1;
var c;
class R;
run;
结果如下：

根据统计分析结果，可以认为三种手术方式之间疗效有统计学差异。
例2：各年龄段的治疗效果资料列于表2，试问各年龄组患病率是否有差别？

卫生统计学（第四版）上的（P91）上讲的是双向有序资料的关联性检验吧？
楼主问的是如何做趋势χ2检验，两个我觉得是不同的，趋势χ2检验实际上可以认为是单向有序资料，（比如以例子的年级为序），趋势χ2检验就是检验率是否有按照年级这个为序的序的某种趋势现象，当然是单调的。
目前我还没有发现用SPSS怎么做趋势χ2检验，我用的是SPSS12，其他版本记不得。没有在SPSS直接找到怎么做Cochran-Armitage Trend Test（即趋势χ2检验）。我觉得如果要看，可以看下图中的Chi-Square Tests表里的Linear-by-Linear Association那一项，这个实际上是对各层的率做的一个线性拟合的检验，可以以这个参考，检验统计量的值也差不多。
这个仅是个人看法，不知是否成熟，还请各位讨论。

spss集中趋势的指标对应的公式，如下所示：
中位数（Median），一组样本数据按升序或降序排列后，如果样本容量为奇数，取蹭位置的数值；如果为偶数，则取中间两个数据的平均值。
众数（Mode）样本中出现次数（频数）最多的数值。
百分位数（PercentileValue）描述离散趋势的统计量——是样本值远离集中趋势统计量程度的定量化描述。
样本方差（Variance）。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/12965113.html

如何利用SPSS进行数据的集中趋势与离散程度分析

发表评论

评论列表（0条）