如何利用R软件绘制散点图

如何利用R软件绘制散点图,第1张

首先,下载并安装好R软件。打开R软件,可以看到R软件主窗口。

为了方便编辑代码,一般不在主窗口直接输入程序。我们可以点击“文件——新建程序脚本”,出现R编辑器。我们将在此输入需要运行的命令。

使用因子格式输入数据。这里输入两组数据,以便后面说明详细使用方法。

输入命令plot(x),表示绘制序列x的散点图。选中程序,右键,点击“运行当前行或选中代码”,运行程序。按F5键或者Ctrl+R键也可以实现。在图标显示框出现散点图了。

输入命令plot(x,y),其中x表示自变量,y是因变量,生成y关于x的散点图。运行命令,即出现散点图。

再增加一组数据,用coplot函数绘制多变量的散点图。coplot(x~m|y)表示在不同的y值下,x关于m的散点图。

7

更多可以查阅相关资料,绘制更美观的散点图。

q1, 首先要确定是barplot还是hist,如果是barplot的话,应该不存在breaks的问题,因为barplot的传入参数是个矩阵;

我假设你要画的是个hist,我偶遇过这个问题,我的理解是hist的breaks的值要能被范围整除才行;比如x=1:200,break=7的话,就只能画出4个柱来,但如果breaks=10就没问题;基本上是这样的,偶尔也有例外;比如break=5就不行....奇怪得很

最后,没办法的办法,就只能用barplot代替hist了,barplot肯定不会有这个问题,统计下hist参数中的分布情况,转换成矩阵,用barplot吧;

q2, 貌似一般都用一组因素把这些类别区分开,我用abcde,表示你的小学,中学...了,比如这样:

a=1:7b=8:10c=c(9,10,11)d=c(40,55)e=100:110f=factor(c(rep(1,sum(length(a),length(b),length(c))),rep(2,sum(length(d),length(e)))))#先用c()生成数组,在转换成factor,其实数组也ok的,不过plot()中两个数组和factor不一样 x=c(a,b,c,d,e)plot(x~f)q3, 就我所知不行;yes或no一定也要是能映射到x,y范围内的点才行;你是想表示分类结果吗?如果是的话,通常用颜色,或者在点旁边的text表示。

q4, 举个例子吧

x=-50:50y=x^2+x+1z=10*abs(x)+1 plot(x,y,type='l')lines(x,z,lty=3)legend(c('type1','type2'), x=-20,y=2500, col=c('black','red'), lty=c(1,3))legend的x和y是legend的左上角,匿名参数是类型名称,col,lty,pch 是对应的颜色,线类型,和点类型。

最后,我现在多用ggplot2,如果不抵触的话可以看看,和R的基础作图包思路不是很一样,但是图很清新的;

如果还有问题,建议把数据集data.frame粘贴几行上来,我也试试;

R是我们做生信进行图形展示较为常用的软件,我们在经常使用R进行数据展示,画一个或者几个图,但我们做生信的,批量化是我们最重要的目标之一。比如有时候可能有几万个图需要画,我们不可能一个一个的去画图,这时候就需要进行批量画图。

R循环画图循环画图挺简单,主要是在dev.off()之前,加上一句print(p)即可,这里的p为画图对象,如下所示:

```

for (i in cluster){

name<-paste(i,'cluster_VlnPlot',sep='_')

mkdirs(paste(outdir,'3_marker',sep='/'),name)

for(m in 1:nrow(all.markers)){

if (all.markers["cluster"][m,]==i){

filename<-paste(gene.list[m],'VlnPlot.pdf',sep='_')

graph <- paste(name,filename,sep='/')

pdf(graph, w=12, h=8)

p<-VlnPlot(object = immune.combined, features.plot = c(gene.list[m]), return.plotlist=TRUE,point.size.use = -1,cols.use=color,size.x.use = -1)

print(p)

plot_grid(p)

dev.off()

}

}

}

```

这里print(p)是循环的关键

我们在画图或者 *** 作的时候,可能有时候某个基因不在我们已有的文件,我们直接循环画图,将会出现报错,而且这个报错后面所有的图都将无法正常完成,因此这里需要使用try语句,如果报错,直接打印报错信息,并且跳过此图,直接画下一幅图,比如:

```

for (i in 1:cluster_num){

tryCatch({gene<-read.table(paste(i,"diff_gene_condition.csv",sep="_"),sep=",",header = TRUE,row.names = NULL)

graph <- paste(prefix,i,'_diff_featureHeatmap.pdf',sep='_')

pdf(graph,w=12, h=8)

gene_FeatureHeatmap<-c()

if (length(gene[,1]) >=6){

gene_FeatureHeatmap<-as.vector(gene[,1][1:6])

}else{

gene_FeatureHeatmap<-as.vector(gene[,1])

}

p<-FeatureHeatmap(immune.combined, features.plot = gene_FeatureHeatmap, group.by = "stim", pt.size = 0.25, key.position = "top",max.exp = 3,do.return =TRUE)

print(p)

plot_grid(p)

dev.off()

},error=function(e){print(paste(i,"--聚类不在某个组中,差异分析画所有聚类的热图出现错误",sep=""))} )

}

```

这里主要使用的语句为:tryCatch({},error=function(e){print(报错信息)} )

这个是我的第一版的try语句画图,并且也成功运行过很多次,包括循环分析、差异分析。

3.第二版循环画图

第一版画图,其实是有bug,只是一直没有遇到画图报错的循环,某次,我再运行这个脚本,其中某个基因的数据在我们画图文件中不存在,结果直接报错,画不出来图,报错信息如下:

Too many open devices r

开始一直不知道原因,后面通过查询报错信息,找到原因(https://stackoverflow.com/questions/24207960/too-many-open-devices-r),原来是因为报错的时候,pdf文件已经建立,但是没有关闭,如果循环太多,将会出现 Too many open devices r 信息。

输入命令:dev.list()

# tiff jpeg tiff jpeg tiff jpeg tiff jpeg tiff tiff tiff tiff tiff jpeg tiff tiff tiff # 23456789 10 11 12 13 14 15 16 17 18

得到如上的信息,说明还有十几张图还没有关闭,使用dev.off()关闭十几次后,就可以正常画图了。

找到原因了,那就得解决,这里的解决方案就是在报错的时候,我们在关闭一下图片文件,并且删掉改文件,打印报错信息,就解决此问题,具体命令如下:

```

if (opt$gene=='yao'){

print('没有输入特定的基因做小提琴图和箱线图,continue!')

}else{

print("输入了特别的基因,将对特定的基因进行热图和小提琴图")

costmer_gene_file<-read.table(opt$gene,sep='\t')

costmer_gene<-unique(costmer_gene_file[,1])

mkdirs(outdir,'3_marker/costmer_gene/')

setwd(paste(outdir,'3_marker/costmer_gene',sep='/'))

for (m in 1:length(costmer_gene)){

tryCatch({

print("开始进行特定的基因表达量分布图绘制。。。。。。。。")

filename<-paste(costmer_gene[m],'FeaturePlot.pdf',sep='_')

pdf(filename, w=12, h=8)

p<-FeaturePlot(object =immune.combined, features.plot = as.character(costmer_gene[m]), min.cutoff = "q9", pt.size = 0.5,cols.use = c("lightgrey","blue"))

print(p)

dev.off()

},error=function(e){

dev.off()

print(paste(costmer_gene[m],"--不在分析分析结果中,基因表达量分布图出现错误,请注意核对",sep=""))

cmd<-paste('rm ',filename,sep=' ')

system(cmd)

} )

}

for (m in 1:length(costmer_gene)){

tryCatch({

print("开始进行特定的基因进行小提琴图绘制。。。。。。。。")

filename<-paste(costmer_gene[m],'VlnPlotPlot.pdf',sep='_')

pdf(filename, w=12, h=8)

p<-VlnPlot(object = immune.combined, features.plot = as.character(costmer_gene[m]), return.plotlist=TRUE,point.size.use = -1,cols.use=color,size.x.use = -1)

print(p)

dev.off()

},error=function(e){

dev.off()

print(paste(costmer_gene[m],"--不在分析分析结果中,基因表达小提琴图出现错误,请注意核对",sep=""))

cmd<-paste('rm ',filename,sep=' ')

system(cmd)

} )

}

cmd<-paste('ls ',paste(outdir,'3_marker/costmer_gene',sep='/'),'/*.pdf|while read ido convert $i `dirname $i`/`basename $i .pdf`.png done',sep='')

print(cmd)

system(cmd)

}

```

到此,循环画图没有问题了。

2019年1月22日


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12154485.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存