TCGA与ICGC。
TCGA, 全称为The Cancer Genome Atlas(癌症基因组图谱)。通过其名称我们就知道这个数据库主要做的就是肿瘤相关的数据库。
ICGC,全称International Cancer Genome Consortium(国际癌症基因组联盟)。这个数据库和TCGA的关系,就是ICGC数据库包括了TCGA的数据。另外呢,ICGC也纳入了其他别的地区所做的队列的测序数据。所以如果使用ICGC进行检索的话,我们可以得到更多的数据。
一个良好的开端就是分析感兴趣基因的突变和其它异常,ICGC数据门户提供了几条研究路线。输入一个基因名称,NCBI登录号,或者Ensembl基因ID,点击基因报告(Gene Report),就能在突变摘要(Mutation Summary)中找到已发现的突变和拷贝数变化,以及迄今为止,这些突变在肿瘤中出现的频率。COSMICsection就在体细胞突变列表下方,包括了点突变,少量缺失,以及插入突变等方面的数据。
一个。
一个数据集就够了,多个数据集合需要合并为一个。一个基于TCGA数据库,不需要注册登录即可进行可视化分析的网页,不需要代码,里面内容十分丰富,提供了最详细的TCGA在线分析展示。
cBioPortal显着降低了复杂基因组数据与癌症研究人员之间的获取障碍,促进快速、直观、高质量地获取大规模癌症基因组学项目的分子谱和临床预后相关性。目前存储DNA拷贝数数据(每个基因的假定,离散值,例如“深度缺失”或“扩增”,以及log2水平),mRNA和microRNA表达数据,非同义突变,蛋白质水平和磷蛋白水平(RPPA)数据,DNA甲基化数据和有限的临床数据。
TCGA由NCI牵头,作为美国攻克癌计划的一个大的project,投入巨大的人力和资金,较早的进行深度测序,提供Gene expression, DNA methylation, Copy Number Variant, Mutation还有更深度的exon expression外显子测序结果,其临床数据整理的相对最完整,指标最多。在TCGA中直接下载数据的方法较为繁琐,但是有多个网站提供TCGA数据(包括表达和临床等)完善的整理:GDAC, Cancer Browser和cBioportal是其中整理最为完整和可靠的。GDAC由美国MIT和Harvard共建的Broadinstitute运行,UCSC运行着Cancer Browser 和Xena, cBioportal由MemorialSloan-Kettering Cancer Cente建立,提供较为完善的TCGA数据为基础的各类信息检索服务。
DataTable dt = new DataTable();
dtColumnsAdd(new DataColumn("PreRevDate0", typeof(decimal)));
DataColumn col = new DataColumn();
colColumnName = "PreRevDate1";
colExpression = "ABS(ConvertToInt32(PreRevDate0))";
colDataType = typeof(decimal);
dtColumnsAdd(col);
DataRow dr = dtNewRow();
dr["PreRevDate0"] = -1;
dtRowsAdd(dr);
从数据库筛选和预后有关的突变方法如下:
1、进入官网首页>
以上就是关于TCGA和ICGC需要归一化吗全部的内容,包括:TCGA和ICGC需要归一化吗、怎么利用TCGA数据库查某个基因的表达量、生信分析需要几个数据集等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)