TCGA由NCI牵头,作为美国攻克癌计划的一个大的project,投入巨大的人力和资金,较早的进行深度测序,提供Gene expression, DNA methylation, Copy Number Variant, Mutation还有更深度的exon expression外显子测序结果,其临床数据整理的相对最完整,指标最多。在TCGA中直接下载数据的方法较为繁琐,但是有多个网站提供TCGA数据(包括表达和临床等)完善的整理:GDAC, Cancer Browser和cBioportal是其中整理最为完整和可靠的。GDAC由美国MIT和Harvard共建的Broadinstitute运行,UCSC运行着Cancer Browser 和Xena, cBioportal由MemorialSloan-Kettering Cancer Cente建立,提供较为完善的TCGA数据为基础的各类信息检索服务。
——Biomart下载基因和motif位置信息
科研过程中我们经常会使用Ensembl(>
第一阶段是基础知识学习,找一本覆盖面广但是又不是很难啃的教材先对生物信息所涉及各个方面有所了解,比如人卫版李霞主编那本《生物信息学》。
第二阶段是一个逐步深入的过程,这个过程中要学会工具的使用。比如编程是学Perl还是Python,现在R也得学了。算法方面最基本的那几个比如Smith-Waterman、Needleman-Wunsch、Dynamic Programming等要了解清楚,结合一些工具比如blast来学习。一些数据库网站也是需要了解清楚的比如NCBI之类的就不用说了,比如很多人都用DAVID来进行生物模式识别分析了当碰到来与你讨论的人时你也要有所了解才行,合理地寻找和利用资源。多看e文书和文档吧,多动手写,一定要动手写。
第三阶段是进行研究,就你个人的兴趣或者你的工作需要选定一个/些领域来研究,进一步学习更多东西,这就学无止境了,HMM啦Bayes啦ANN啦……比如我就对高通量测序和肿瘤遗传学感兴趣那么我就来研究这个。
以上就是关于tcga数据库firebrowse数据怎么分析全部的内容,包括:tcga数据库firebrowse数据怎么分析、如何获取目标基因的转录因子(上)、如何自学生物信息学等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)