为什么编码区序列在全基因组中找不到

为什么编码区序列在全基因组中找不到,第1张

使用NCBI的BLAST或者UCSC genome browser的BLAT去比对

dbSNP中的序列是SNP位点上下游附近的基因组序列,而NCBI上你找到的相关基因的序列往往都是mRNA序列,如果rs序列有内含子部分,自然你在mRNA上不可能找到对应的序列,另外,有可能rs序列和该基因转录方向是相反的,这样你仍然找不到,另外,序列比对无须用word,这不是个合适的方法,你应该使用NCBI的BLAST或者UCSC genome browser的BLAT去比对。

医学文献常用数据库:Pubmed

我常用很多跟遗传病有关的数据库,有:OMIM(人类孟德尔遗传数据库)、HGMD(人类基因突变数据库)、Clinvar(NCBI临床突变数据库)、gnomAD(人群频率数据库)、dbSNP(人群频率数据库)、InterVar(位点致病性评判)、GeneReviews(疾病数据库)、PharmGKB(药物基因组数据库)、常用预测软件数据库。

跟CNV分析有关的数据:DGV(基因组变异数据库)、Decipher(拷贝数变异数据库)、ClinGen数据库(剂量敏感判断数据库)、UCSC Genome Browser(基因组浏览器)。

表型库:HPO(人类本体表型库)、CHPO

上面是我常用的数据库,不知是不是您问的内容,当然查文献最多还是在pubmed。

去ucsc genome browser,找到菊花对应基因组,搜索感兴趣的基因,在下面就会显示对应的转录本,粗的深色部分代表外显子,外显子之间相连的较细部分就是内含子。

如果需要序列信息可以去ensemble搜索菊花基因组,搜索基因,然后export,选择intron就可以输出intron部分序列信息了

UCSC是生物领域里常用的数据库之一,由University of California Santa Cruz (UCSC)创立和维护,主要包含了人类、小鼠、果蝇等多种常见动物的基因组信息。UCSC里也包括了一系列的分析工具,帮助用户浏览基因信息、查看已有基因组注释信息和下载基因序列等。

在生物信息分析过程中,有时会需要fasta、GTF或BED等格式的数据文件,而UCSC是这些文件的主要下载来源之一。本文主要以人的基因组信息为例讲述如何在UCSC上下载想要的数据库和交叉数据库。

UCSC主界面如图所示,我们找到Table Browser点击进入。

在UCSC的主页上,点击Genomics,然后点击human图标,获取其他物种的染色体长度。

染色体(chromosome)是细胞在有丝分裂或减数分裂时DNA存在的特定形式。细胞核内,DNA紧密卷绕在称为组蛋白的蛋白质周围并被包装成一个线状结构。当细胞不分裂时,染色体在细胞核中是不可见的——在显微镜下也是如此。

以上就是关于为什么编码区序列在全基因组中找不到全部的内容,包括:为什么编码区序列在全基因组中找不到、常用医学中文数据库有哪几种,有何特点、怎样在菊花基因组数据库中找到基因的内含子等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9532565.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-29
下一篇 2023-04-29

发表评论

登录后才能评论

评论列表(0条)

保存