GEO挖掘实战二、差异分析及富集分析

GEO挖掘实战二、差异分析及富集分析,第1张

「生信技能树」三阴性乳腺癌表达矩阵探索 系列笔记

GEO挖掘实战一、初步探索数据 -

GEO挖掘实战二、差异分析及富集分析 -

GEO挖掘实战三、GSVA -

GEO挖掘实战四、TNBC相关探索 -

芯片数据的差异分析一般使用limma包

之前学习RNA-seq转录组学习时,对富集分析的概念与流程有过一定的了解。主要分为ORF与GESA两类,都可用clusterProfiler包完成。在曾老师的视频中后者是使用了MsigDB的数据集进行分析的。

- RNA-seq学习:No5富集分析--ORF过表达 -

- RNA-seq学习:No6富集分析--GESA -

主要需要上下调基因的ENTREZID

需要准备genelist数值型字符串,即为logFC值,从大到小排列;并以ENTREZID/SYMBOL命名。

ArcGIS是围绕着Geodatabase数据库构建的,它使用对象关系型数据库来存储空间数据。Geodatabase是一个存储数据集的容器,同时将空间数据和属性绑定起来。拓扑数据也能够存储在Geodatabase中并对特性进行建模,比如说在表示道路交叉时可以对道路之间的相关性进行设定。在使用Geodatabase时,很重要的一点就是要理解要素类(Feature Classes)就是就是一系列要素,它以点、线或多边形的形式呈现。在使用Shapefile格式时每个文件只能存储一类要素然而Geodatabase却能够在一个文件中存储多个要素或者是多种类型的要素。

在ArcGIS中Geodatabase可以以三种不同方式存储包括FGDB(File Geodatabase)、PGDB(Personal Geodatabase),和ArcSDE Geodatabase。FGDB在92版时被引进,它把信息储存在一个扩展名为gdb的文件夹中,文件夹内部的文件和Coverage差不多但不一样。和PGDB类似,FGDB也支持单一用户,但与PGDB不同的是,FGDB没有数据量大小的限制。默认情况下单一表的大小不能超过1TB,但这实际是可以被改变的。PGDB用Microsoft Access文件存储数据,将几何数据存储在二进制大对象字段中,OGR库能够处理这种文件类型并将它转换其它文件格式。一些需要数据库管理员完成的工作诸如管理用户及备份等可以通过ArcCatalog完成。基于Microsoft Access的PGDB仅能在Windows *** 作系统下运行而其有2GB数据量上线的限制。企业级的Geodatabase可以通过ArcSDE *** 作,它拥有可连接高端数据库管理系统(DBMS)的接口像是Oracle、Microsoft SQL Server、DB2和Infomix等。这些DBMS能够多方面的管理数据库,同时ArcGIS就用来进行空间数据的管理。企业级的Geodatabase还支持数据库复制、版本控制及事务管理等高级功能,更支持跨平台兼容,即可同时在Linux、Windows和Solaris等不同的 *** 作系统下使用。

你好,是准确的。这个就涉及到GEO2R的使用目标了。GEO2R只适用于 表达谱芯片分析。但是GEO数据里面,并不止是包括表达谱芯片数据。还包括一些二代测序的数据。而二代的数据是不能这么简单的分析的,这也是为什么我们在第一次介绍GEO的时候,就说,现在常规的容易入门的数据分析类型还是 表达谱数据。

一般我们在GEO检索结果的时候,如果可以用GEO2R分析的,都会显示。

请问将二代测序得到的序列比对到miRBase鉴定已知miRNA时,应选择miRBase中的mature序列还是hairpin序列啊?

看到miRBase中同时有hairpinfa和maturefa两个数据文件,迷惑了

geo数据库筛选数据方法是:

1、首先,打开NCBI,选择GEODatasets,输入GDS5656,点击Search。

2、点击样品分类号,我们可以看到该研究的详情,包括文章研究内容、实验方案设计、样本详情等。

3、点击AnalyzewithGEO2R,利用在线工具进行数据分析。将4个样本分成了两组,分组完毕后,点击saveallresults,获取两组之间的差异表达基因。

4、得到如下所示的文本内容,将其粘贴到记事本(例如,保存为resulttxt),然后导入到excel中(数据→自文本,选择resulttxt文件导入),准备进行筛选。

5、下一步,我们需要对差异表达基因的数据进行进一步的筛选。

6、最后我们可以在EXCEL左下角的状态栏看到,一共筛选出来738个条目。

含义不同。geo和go分析的区别是含义不同,go不是数据库,GEO数据是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它创建于2000年,收录了世界各国研究机构提交的高通量基因表。

以上就是关于GEO挖掘实战二、差异分析及富集分析全部的内容,包括:GEO挖掘实战二、差异分析及富集分析、我就问什么是ArcGIS中的Geodatabase数据库、geo数据库里的高表达低表达准确吗等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9388988.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-27
下一篇 2023-04-27

发表评论

登录后才能评论

评论列表(0条)

保存