本文是个人笔记,请谨慎付费[星球用户可免费看]。
热图(Heat map) 是一个以 颜色 变化来显示数据的 矩阵 。虽然“热图”是一个新兴的词悉如汇,但是用明暗的矩阵来标示元素的方法已经睁则启有超过一世纪的历史了。
热图源自于展示数据的平面图像,较大的数字以小的深灰色、黑色方格呈现,而较小的数字则以较亮的方格标示。如Toussaint Loua在1873年就曾使用这样的手法来绘制对 巴黎 各区的社会学统计。 [1] 彼得·斯伊斯在1957年时进行 群集分析 时也透过置换矩阵的行和列的方法将更相似的值标示在一起。雅克·贝尔坦也曾用过类似的方法标示出 累积量表 的资料。而将 阶层式分群法 加入到矩阵中的概念则是由罗伯特·F·林于1973年创造,他利用多次印刷堆叠出的字符来表示不同程度的灰色,将每个字符大小则视为一像素。利兰·威尔金盯团森则是于1994年开发出了第一个能生成高分辨率的矩阵的计算机程序—SYSTAT。
软件设计师科尔马克·金尼则在1991年时注册了热图这个商标用以形容一种描绘金融市场信息的平面图形, [2] 但是取得了金尼发明的公司在2003年时不小心使得这个商标失效了 [3]
前言: 仍然是三代测序数据的分析,宏基因组的文章中经常出现聚类热图和物种丰度图,用来直观地识别与某些疾病或者表型相关的菌群构成。
1.读取数据
一共有11个样本,每一个样本的测序reads都经过Nanopore官方的Epi2Me程序鉴定了物种,下表中册埋灶第一列是被鉴定的菌种,第二列是该样本中每个物种产生的reads数目。
首先导入到R语言中,合并所有样本到一个数据框:
2.绘制热图
经过上一步,我们得到了列名为样本,行名为菌种的reads数据框,然后就可以绘制热图,进行聚类分析液含了:
绘制结果:
3.绘制物种丰度图
丰度图,其实就是堆积图,把每个样本的reads数州扮目转换为百分数,然后作图就可以了:
绘制结果:
作业
读取文件用得比较多的参数有:
“header”,“sep”,“quote”,“na.strings”,“fill”,“strip.white ”,“blank.lines.skip”,“comment.char ”,“”等等。
read.csv里的参磨键数不多,如运行以下命令时,读取文件用得比较多的参数有,“header”,“ sep ”,“ quote”,“dec”,“fill ”帆伍,“comment.char ”。
在RStudio中从文件夹“file”的子目录“New file”里打开R markdown:
了解markdown一些选项和图标的功能:
如图中的解释:
R语言中的pheatmap包瞎轿巧是制作热图的一个工具,在基因表达中,根据得来的实验数据,在使用pheatmap制作的基因表达或其它测试结果的热图中,如可以用不同颜色展示基因的表达量的差异。
注:引用网上的数据( https://blog.csdn.net/sinat_38163598/article/details/72770404 )练习,刚接触,需要花一些时间去了解
补充:
1.今天涉及到一些快捷键的使用
输入简单的向量,paste和paste0输入方式是一样的,如:
输入多个向量,paste需要在每个向量间用sep = " ",分开。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)