2、接下来就是开始做回归分析建立模型,研究其变化趋势,因为回归分析分为线性回归和非线性回归,分析它们的办法是不同的,所以先要把握它们的变化趋势,可以画散点图,点击图形---旧对话框---散点/点状。
3、选择简单分布,并点击定义,这种散点图是我们常见的,而其他几种都比较复杂,用到这儿就把简单问题复杂化了。
4、在接下来的d出框中设置x轴和y轴,然后点击确定,其他都不要管,然后得到散点图,可以看出x轴和y轴明显呈线性关系,所以接下来的回归分析就要用线性回归方法,假设图像呈曲线就需要选择曲线拟合的方法。
5、点击分析---回归---线性,在d出的线性回归框中设置自变量和因变量,其他的选项用默认设置即可,其他的选项只是用来更加精确地去优化模型。
6、接下来就是结果分析了,一共在输出文档中d出了四张表其中系数表就是所求出来的模型,根据B列写出函数表达式,这道题就是y=1594x+26659,sig均小于005表示自变量对因变量有显著影响。
7、Anova表表示分析结果,主要看的是F和Sig值,F值对应的Sig值小于005就可以认为回归方程是有用的,模型汇总表中R表示拟合优度,值越接近1表示模型越好。近日又有不少盟友咨询说看到文献中率的比较用了Cochran–Armitage trend tests,纷纷问我这是什么高大上的统计方法,其实这就是我们常说的趋势卡方检验,并不是什么高大上的新方法。当处理有序分类变量时,我们常会使用到趋势卡方检验与秩和检验,那么两者使用的区别在哪里呢,使不少盟友产生疑惑,以下是统一解答与回复。
02
使用情况
当“分析变量”(列变量)是有序多分类变量时,分组变量(行变量)不是有序多分类变量时,例如当比较2种手术方式的治疗效果时 ,“非常差,差,一般,好,非常好”,这时的疗效评价就是分析变量,手术方式是分组变量,这个时候需要用秩和检验,结果如果有差异,看平均秩次,平均秩次越大,疗效越好。
当“分组变量”(行变量)是有序多分类变量时,分析变量(列变量)不是有序多分类变量时,比如,不同年龄段(20-,30-,40-,50-,)的疾病患病率情况,这个时候不同年龄段是分组变量,为有序多分类变量,分析变量是患病与否,可以用卡方检验,如果卡方检验有统计学差异,再看下面的卡方趋势检验结果,有差异说明随着年龄段的增加,患病率越来越高或越低。
03
举例分析
例1:三种手术方式的治疗效果资料列于表1,试问三组手术方式间疗效是否有差别?
表1 三种手术方式间疗效统计
手术方式
疗效
合计
无效
好转
治愈
A
5
32
20
57
B
30
18
10
78
C
15
10
10
35
合计
50
80
40
170
分析:显然此例手术方式为无序分类的分组变量,疗效为有序分类的分析变量,应采用秩和非参检验进行分析,SAS代码如下:
data zhihe1;
do R=1 to 3;
do C=1 to 3;
input F@@;
do i=1 to F;
output;
end;
end;
end;
cards;
5 32 20
30 18 10
15 10 10
;
run;
proc npar1way wilcoxon data=zhihe1;
var c;
class R;
run;
结果如下:
根据统计分析结果,可以认为三种手术方式之间疗效有统计学差异。
例2:各年龄段的治疗效果资料列于表2,试问各年龄组患病率是否有差别?卫生统计学(第四版)上的(P91)上讲的是双向有序资料的关联性检验吧?
楼主问的是如何做趋势χ2检验,两个我觉得是不同的,趋势χ2检验实际上可以认为是单向有序资料,(比如以例子的年级为序),趋势χ2检验就是检验率是否有按照年级这个为序的序的某种趋势现象,当然是单调的。
目前我还没有发现用SPSS怎么做趋势χ2检验,我用的是SPSS12,其他版本记不得。没有在SPSS直接找到怎么做Cochran-Armitage Trend Test(即趋势χ2检验)。我觉得如果要看,可以看下图中的Chi-Square Tests表里的Linear-by-Linear Association那一项,这个实际上是对各层的率做的一个线性拟合的检验,可以以这个参考,检验统计量的值也差不多。
这个仅是个人看法,不知是否成熟,还请各位讨论。spss集中趋势的指标对应的公式,如下所示:
中位数(Median),一组样本数据按升序或降序排列后,如果样本容量为奇数,取蹭位置的数值;如果为偶数,则取中间两个数据的平均值。
众数(Mode)样本中出现次数(频数)最多的数值。
百分位数(PercentileValue)描述离散趋势的统计量——是样本值远离集中趋势统计量程度的定量化描述。
样本方差(Variance)。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)