SAS code:
proc freq data=yourdata;
tables a*b/chisq expected;
run;
这里a指记录第一组和第二组的变量,b指记录男女的变量。chisq就是卡方检验,expected输出每个格子的理论频数。如果有格子理论频数小于5,就要看矫正卡方检验的结果。结果主要就是看卡方检验对应的值,如果p值小于0.05,就可以认为两组之间男女存在统计学差异。
对于一个初学统计者,处处碰壁是没错了。在初学统计的时候,还被要求学习SAS,更是头疼。因为刚学会SPSS的基本 *** 作还没太久。
对于在这个路上摸索了大半年的我,终于也能写出一些程序的时候,感觉也是酷酷的。
在学统计的时候经常碰到这么个问题,一个无序分类变量(如,性别),一个有序分类变量(如疗效,教育水平),在做统计检验的时候,怎么做?
那当有序分类变量作为结局指标时会出现以下两种情况:
1、性别与教育水平是否相关;或者比较性别与教育水平构成有与差异;
2、性别分组,有序分类变量(疗效,教育水平)是否呈现等级差异?即将疗效和教育水平当做等级变量。
对于第一种情况,选择的方法则为卡方;对于第二种情况,则需用非参,常用的是多组独立样本比较的秩和检验(Kruskal-Wallis test)
举例:
对于只分析是否相关,用卡方检验,SAS程序如下:
结果为:
而如果当做有序变量,则SAS程序如下:
结果如下:
两种情况,方法不同,结果也不同。
另外,在做非参时,困惑了很久的是怎么将 count加权,最后从教科书里发现是freq count。
关于我的界面可能跟大部人不一样,因为我用的是SAS Studio-University版,对于安装和使用SAS也是捆绑了很久,现在不再纠结于烦恼,就继续用这个,基本的分析都是没有问题的。
如果你已经将结果整理到一个数据集中,那么直接定义表的输出格式就好:proc report
style(report)=
{background=white rules=groups frame=hsides} *输出三线表的格式
程序参考这篇博客:http://blog.163.com/cym_chenyimin/blog/static/27611668620178274536408/
如果还没有将结果整到一个数据集,或表的格式比较繁琐,那么必须应用proc report过程进行整理和控制,这个你可以参考这篇博客,博主使用sas程序将t检验结果和卡方检验的结果整合到一张三线表中,你可以注重看下博主proc report 过程(stepd)
http://blog.163.com/cym_chenyimin/blog/static/27611668620178229306623/
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)