1、R语言可以导出csv格式的文件供Excel使用,具体的使用方法首先打开RStudio软件:
2、先定义一个随机生成一个包含10个正态分布数据的向量,然后输出它,使用csv函数导出csv文件,函数中第一个参数为导出的变量名nx,第二个参数为导出的文件名称和路径:
3、接着按下windows+E键打开资源管理器,双击打开生成的csv文件即在Excel中看到数据了:
本文第一大部分将介绍用R软件的meta分析数据包实现相关系数的Meta分析,第二大部分如何用R语言进行多变量的meta分析。
想获取R语言相关系数meta分析的程序模板的同学请在公众号(全哥的学习生涯)内回复“相关系数”即可。
meta数据包提供实现相关系数的Meta分析命令是:metacor(),这个命令通过加权的倒方差法运用相关系数和纳入的样本数来实现相关系数的随机效用模型和固定效用模型的合并,得到合并的相关系数及95%可信区间。具体的命令如下:
metacor(cor, n,studlab, data= NULL, subset=NULL, sm=settings$smcor)
cor为每一个纳入研究的相关系数, n为样本量, studlab纳入研究的标签向量, data为相应的的数据集,sm选项为合并的方法,包括ZCOR和COR,其中ZCOR是合并之前先做Fisher Z变换,COR是直接合并。具体的步骤如下:
library(meta)
data<-readcsv(“C:/Users/86187/Desktop/datacsv”)
录入的数据见图1。
data<-metacor(r,n,data=m1,sm="ZCOR")
在这里合并的方法用的是Fisher Z变换。对样本的相关系数做Fisher Z变换是因为Fisher Z变换可以使样本的相关系数的分布正态分布,尤其是在样本量较小的时候,这样便于进一步估计。一般来说,不管是随机还是固定效应都会先对相关系数做Fisher Z变换。只有很少的情况下才直接用相关系数直接来做分析,比如样本量很大的时候,如果直接合并相关系数,当相关系数值接近1的时候,小样本量研究得到的权重会非常大。因此在这里推荐合并的方法都用(ZCOR)Fisher Z变换。Meta分析的结果见图2。
结果显示,异质性检验Q=616, P=00461, I2=675,可以认为有统计学意义上的异质性。选用随机效用模型,COR=08427, 95%CI: 06264-09385, z=48724, P<00001, 有统计学差异。
具体的命令如下:
forest(a)
从森林图中,非常简单和直观地看到Meta分析的统计结果,见图3
关于这两个方法的介绍请看我之前公众号(全哥的学习生涯)的推送文章(如何用R语言进行meta分析,详细教程一)的内容。敏感性分析和剪补法的结果图分别见图4和图5。
通常Meta分析假定效应量来自于独立的研究,因此统计结果也是独立的。然而,许多研究不能满足独立性的假设,比如多个治疗组与一个共同的对照组比较的研究和多个结局变量的研究就可能产生效应量之间的相关。多变量meta 分析(multivariate meta⁃analysis)作为单变量meta分析的一个拓展,可合并估计多个研究的多个相关参数,这些参数可以是多个结局或多组间的比较。当同一总体中的测量结局相关时,分别对每个结局进行Meta 分析,测量结局之间的相关结构就可能被忽略。多变量Meta分析在随机对照研究中有多种应用,最简单的是在临床试验中把每个组的结局分别处理,其他的应用还有同时探索两个临床结局的治疗效应,或同时探索成本效益的治疗效应,比较多个治疗的联合试验,以及在观察性研究中评估暴露量与疾病之间的相关性,还有在诊断试验和网络干预中的应用。
本次数据来源请见文末的参考文献,主要研究肝硬化的非手术治疗方式预防其出血的危险性,以初次出血的例数为指标,其中三个组分别是:β⁃受体阻滞剂(A),硬化疗法(B),对照组(C),目的是评价这三种非手术治疗方式预防肝硬化出血的效果。,Bled表示初次出血的例数,Total表示干预组的总例数。YAC和YBC分别表示A、B两组相对于C组估计的ln(OR),即干预组的肝硬化初次出血的危险性是对照组的倍数的自然对数;SAA、SBB和SAB则表示其对应方差及两者之间的协方差。对于包含0的研究(研究10和研究20),在每个组增加05个初次出血的例数。整理后见表1。
随后安装调用程序包,并进行加载:
installpackages(‘mvmeta’)
library(mvmeta)。
随后将肝硬化初次出血整理后的数据集data(至少包含YAC、YBC、SAA、SAB、SBB变量)保存为csv格式,然后利用下面命令将其导入R语言。
mvmeta 的语句:mvmeta(formula,S,data,subset,method=“reml”,bscov=“unstr”,model=TRUE,contrasts=NULL,offset,naaction,control=list())
其中formula 表示结局变量名称(即YAC、YBC);S 表示研究内(协)方差(即SAA、SAB、SBB);data 表示数据集名称;method 表示所用的估计方法:固定效应模型时选择FIXED;随机效应模型时则选择
限制性最大似然估计(REML)、最大似然估计(ML)、矩估计(MM)、方差成分法(VC)的其中之一,默认为REML。由输出结果中Q 检验的P 值和I2 统计量来判断异质性以及选择何种效应模型。
mvmeta包中主要提供了多变量Meta分析与多变量的Meta 回归,另外也提供了单变量的Meta 分析和Meta 回归。但对于后两者,在R 语言中的metafor、meta、rmeta 及metalik 等包提供了更多、更详尽和有效的功能。多变量Meta 程序为library(mvmeta),调用mvmeta软件包。
model<-mvmeta(cbind(Ya,Yb),S=S,data=cirrhosis)
model <- mvmeta(cbind(Ya,Yb)~X,S=S,data=cirrhosis),此处X代表协变量。
model<-mvmeta(Y,S=S,data=cirrhosis),此处Y为单变量的效应量,S为效应量方差。
model<-mvmeta(Y~X,S=S,data=cirrhosis),此处X代表协变量。
运行以上程序后,最后将结果输出。
单变量和多变量Meta分析都是采用ln(OR)值做分析。单变量Meta分析时YAC和YBC的Q检验P 值均小于005,I2统计量分别为577%和778%。多变量Meta分析Q检验P<005,I2统计量为739%。可知两种Meta 分析均存在异质性,都用随机效应模型。估计方法选择默认的REML法。
表2 是单变量Meta 分析结果,可得:AC 与BC的OR 值及95%可信区间分别为05281(02802,09955)、05406(03095,09443),表明初次出血的危险性由于干预而降低,即β⁃受体阻滞剂、硬化疗法可以预防肝硬化出血,两者为保护因素。
多变量Meta 分析的结果:YAC 为-06755(-13073,-00438),YBC 为-05938(-11444,-0043 2),研究间相关系数为0436 5(见表3),A组与B组的治疗效果呈正相关。OR 值及95%可信区间分别为0508 9(02705,09571)、05522(0318 4,0957 7),多变量Meta 分析的结果说明β⁃受体阻滞剂预防肝硬化出血的效果是最好,其次是硬化疗法。OR 值的95%可信区间不包含1,上下限均小于1,说明两种疗法与对照组比较的初次出血危险性均小于1,差异有统计学意义。
最后,如果屏幕前的你对R语言学习还有什么问题或者看法,可以在我的公众号(全哥的学习生涯)给我留言,公众号里也有我的个人****,我也希望可以结合更多志同道合的伙伴。
感谢你的阅读。
#导入你的矩阵,我的矩阵是包含列名称和行名称的
exp = readtable('exptxt', header = TRUE ,sep = '\t' )
require(graphics)#调用PCA画图的包
#做PCA时,不要行名称所以从第二列开始
PCA1 = princomp(exp[,2:(dim(exp)[2]-1)] )
summary(PCA1)
pc = loadings(PCA1)
Comp1 = PCA1$loadings[,1]
Comp2 = PCA1$loadings[,2]
plot(Comp1,Comp2 ,col = c('red','red','red','green','green','green','blue','blue','blue'))
#此数据分为三组,所以我画了不同的颜色。
#这是做PCA以及画图的简单流程,供参考!
以上就是关于怎样在Rstudio环境生成R语言的可执行程序全部的内容,包括:怎样在Rstudio环境生成R语言的可执行程序、如何用R语言进行相关系数与多变量的meta分析、用R语言做PCA的具体步骤等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)