icgc数据库的数据需要log fpkm+1嘛

icgc数据库的数据需要log fpkm+1嘛,第1张

需要。

当我们使用TCGA表达数据,数据以gene-samplematrix形式整理好了,ICGC也是一个很大的癌症数据库,存放了几十种癌症的数据。我们需要将系数矩阵修改成gene-sample。

一个良好的开端就是分析感兴趣基因的突变和其它异常,ICGC数据门户提供了几条研究路线。输入一个基因名称,NCBI登录号,或者Ensembl基因ID,点击基因报告(Gene Report),就能在突变摘要(Mutation Summary)中找到已发现的突变和拷贝数变化,以及迄今为止,这些突变在肿瘤中出现的频率。COSMICsection就在体细胞突变列表下方,包括了点突变,少量缺失,以及插入突变等方面的数据。

TCGA与ICGC。

TCGA, 全称为The Cancer Genome Atlas(癌症基因组图谱)。通过其名称我们就知道这个数据库主要做的就是肿瘤相关的数据库。

ICGC,全称International Cancer Genome Consortium(国际癌症基因组联盟)。这个数据库和TCGA的关系,就是ICGC数据库包括了TCGA的数据。另外呢,ICGC也纳入了其他别的地区所做的队列的测序数据。所以如果使用ICGC进行检索的话,我们可以得到更多的数据。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/10022893.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-04
下一篇 2023-05-04

发表评论

登录后才能评论

评论列表(0条)

保存