如何利用SPSS进行数据的集中趋势与离散程度分析

如何利用SPSS进行数据的集中趋势与离散程度分析,第1张

集中趋势可以看平均值和中位数;以及离散程度可以看标准差,标准差比如为1,平均值为4,说明数据沿着平均值周围波动25%(1/4),这个挺简单的,但是软件帮你计算才行,手工算太麻烦了。建议你可以使用在线SPSS分析软件进行分析,SPSSAU里面有智能化文字分析这些,非常傻瓜简单。

1、打开SPSS软件后点击右上角的打开文件按钮打开你需要分析的数据文件。
2、接下来就是开始做回归分析建立模型,研究其变化趋势,因为回归分析分为线性回归和非线性回归,分析它们的办法是不同的,所以先要把握它们的变化趋势,可以画散点图,点击图形---旧对话框---散点/点状。
3、选择简单分布,并点击定义,这种散点图是我们常见的,而其他几种都比较复杂,用到这儿就把简单问题复杂化了。
4、在接下来的d出框中设置x轴和y轴,然后点击确定,其他都不要管,然后得到散点图,可以看出x轴和y轴明显呈线性关系,所以接下来的回归分析就要用线性回归方法,假设图像呈曲线就需要选择曲线拟合的方法。
5、点击分析---回归---线性,在d出的线性回归框中设置自变量和因变量,其他的选项用默认设置即可,其他的选项只是用来更加精确地去优化模型。
6、接下来就是结果分析了,一共在输出文档中d出了四张表其中系数表就是所求出来的模型,根据B列写出函数表达式,这道题就是y=1594x+26659,sig均小于005表示自变量对因变量有显著影响。
7、Anova表表示分析结果,主要看的是F和Sig值,F值对应的Sig值小于005就可以认为回归方程是有用的,模型汇总表中R表示拟合优度,值越接近1表示模型越好。

近日又有不少盟友咨询说看到文献中率的比较用了Cochran–Armitage trend tests,纷纷问我这是什么高大上的统计方法,其实这就是我们常说的趋势卡方检验,并不是什么高大上的新方法。当处理有序分类变量时,我们常会使用到趋势卡方检验与秩和检验,那么两者使用的区别在哪里呢,使不少盟友产生疑惑,以下是统一解答与回复。
02
使用情况
当“分析变量”(列变量)是有序多分类变量时,分组变量(行变量)不是有序多分类变量时,例如当比较2种手术方式的治疗效果时 ,“非常差,差,一般,好,非常好”,这时的疗效评价就是分析变量,手术方式是分组变量,这个时候需要用秩和检验,结果如果有差异,看平均秩次,平均秩次越大,疗效越好。
当“分组变量”(行变量)是有序多分类变量时,分析变量(列变量)不是有序多分类变量时,比如,不同年龄段(20-,30-,40-,50-,)的疾病患病率情况,这个时候不同年龄段是分组变量,为有序多分类变量,分析变量是患病与否,可以用卡方检验,如果卡方检验有统计学差异,再看下面的卡方趋势检验结果,有差异说明随着年龄段的增加,患病率越来越高或越低。
03
举例分析
例1:三种手术方式的治疗效果资料列于表1,试问三组手术方式间疗效是否有差别?
表1 三种手术方式间疗效统计
手术方式
疗效
合计
无效
好转
治愈
A
5
32
20
57
B
30
18
10
78
C
15
10
10
35
合计
50
80
40
170
分析:显然此例手术方式为无序分类的分组变量,疗效为有序分类的分析变量,应采用秩和非参检验进行分析,SAS代码如下:
data zhihe1;
do R=1 to 3;
do C=1 to 3;
input F@@;
do i=1 to F;
output;
end;
end;
end;
cards;
5 32 20
30 18 10
15 10 10
;
run;
proc npar1way wilcoxon data=zhihe1;
var c;
class R;
run;
结果如下:

根据统计分析结果,可以认为三种手术方式之间疗效有统计学差异。
例2:各年龄段的治疗效果资料列于表2,试问各年龄组患病率是否有差别?

卫生统计学(第四版)上的(P91)上讲的是双向有序资料的关联性检验吧?
楼主问的是如何做趋势χ2检验,两个我觉得是不同的,趋势χ2检验实际上可以认为是单向有序资料,(比如以例子的年级为序),趋势χ2检验就是检验率是否有按照年级这个为序的序的某种趋势现象,当然是单调的。
目前我还没有发现用SPSS怎么做趋势χ2检验,我用的是SPSS12,其他版本记不得。没有在SPSS直接找到怎么做Cochran-Armitage Trend Test(即趋势χ2检验)。我觉得如果要看,可以看下图中的Chi-Square Tests表里的Linear-by-Linear Association那一项,这个实际上是对各层的率做的一个线性拟合的检验,可以以这个参考,检验统计量的值也差不多。
这个仅是个人看法,不知是否成熟,还请各位讨论。

spss集中趋势的指标对应的公式,如下所示:
中位数(Median),一组样本数据按升序或降序排列后,如果样本容量为奇数,取蹭位置的数值;如果为偶数,则取中间两个数据的平均值。
众数(Mode)样本中出现次数(频数)最多的数值。
百分位数(PercentileValue)描述离散趋势的统计量——是样本值远离集中趋势统计量程度的定量化描述。
样本方差(Variance)。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12965113.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-29
下一篇 2023-05-29

发表评论

登录后才能评论

评论列表(0条)

保存