cox回归是做生存分析的一个半参数模型,目的是找出影响生存的危险因素有哪些,在医学中常用于肿瘤和其他疾病的预后分析.常用的统计软件如SAS和spss都可以实现。
采用分层的cox回归(stratified cox),也就是按协变量分层分析,然而这种方法有个缺点,所谓“分层虽好,也不能贪多啊”。说错了,分层虽好,但该变量也就没有估计结果了。试想,你把主要研究因素分层了,你还研究什么呢?
所以就要说到第二种处理方式,也就是采用时依cox回归,也就是带时依协变量的cox回归。
扩展资料辅助的(ancillary)时依协变量
辅助的时依协变量,跟内部时依协变量有点不同。内部的顾名思义,主要靠自己,而辅助的,则是靠外部的推动而改变。
比如污染状态,这个如果城市的工厂关闭一段时间,大气状况变成了“优”,如果工厂恢复运作,大气状况变成了“污染”,这就随时间而发生了变化,而且是靠外部力量推动的变化。
再比如,工作状态,本来你可能在一家公司工作,结果公司不景气,裁员了,把你解雇了。这不是你内部自身决定辞职,而是被辞职,这就是外部的辅助力量。
installpackages("survival")library(survival)
sur<-Surv(time,status,data=test)
单因素:
summary(coxph(sur~x1,data=test))
summary(coxph(sur~x1+x2+x3,data=test))Box-Cox变换后的数据,可以使回归模型满足线性、误差独立性、误差方差齐性和误差正态性,同时又不丢失信息。
对存在非线性关系的数据,可以使用复杂模型拟合非线性函数来处理非线性问题,但这样的运算更复杂。先采用相对简单的数据转换来尝试将数据关系变为近似线性关系的情况,是更明智的。
一般的数据转换方法:
上述各方法,对 的转换幅度依次增大。
Box-Cox转换形式为:
可变参数 决定具体的变换形式, 时,变换为对数变化。对于任意取值的 ,可改为 ,保证对数的运算。
在应用中,需要估计的参数是 。为使转换后的数据服从线性,即希望 ,则对固定 , 和 的似然为
最大化似然,求得参数 的最优值。
Box-Cox转换通过变换参数 来改变变换的具体形式。整个过程完全基于数据本身,从而比直接选定对数、平方根等方法要客观准确。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)