基因组注释 是利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释。
基因组注释的研究内容包括基因识别和基因功能注释两个方面。基因识别的核心是确定全基因组序列中所有基因的确切位置。从基因组序列预测新基因,现阶段主要是3 种方法的结合:
(1)分析mRNA 和EST数据以直接得到结果;
(2)通过相似性比对从已知基因和蛋白质序列得到间接证据;
(3)基于各种统计模型和算法从头预测。
对预测出的基因进行高通量功能注释可以借助于以下方法,利用已知功能基因的注释信息为新基因注释:
(1)序列数据库相似性搜索;
(2)序列模体搜索;
(3)直系同源序列聚类分析。
扩展资料:
基因注释重大突破:
1、中国科学院水生生物研究所葛峰研究员学科组利用蛋白基因组学的研究策略和方法,成功对单细胞光合真核生物三角褐指藻的基因组进行了深度注释,完成了三角褐指藻的蛋白质组精细图谱,并建立了完整的真核生物基因组深度注释实验技术和分析流程。
该研究成果的取得,有望进一步推动蛋白基因组学在生命和健康领域特别是精准医学方面的应用。
2、美国加州大学旧金山分校研究人员发现,GABP蛋白的一种特定成分GABP-β1L,是与端粒酶逆转录酶(TERT)启动子突变相关的胶质母细胞瘤细胞不受控制地分裂、繁殖的关键。
他们10日在《肿瘤细胞》杂志上发表论文称,新发现提供了一个很有前途的用药靶点,对未来胶质母细胞瘤及其他多种与TERT启动子突变相关癌症的治疗具有重要意义。
参考资料来源:百度百科-基因组注释
1、starBase一个高通量实验数据CLIP-Seq(或称为HITS-CLIP,PAR-CLIP,iCLIP)和mRNA降解组测序数据支持的microRNA靶标数据库,包含了miRNA-mRNA,miRNA-lncRNA,miRNA-circRNA,miRNA-ceRNA 和RNA-protein等的调控关系。整合和构建多个流行的靶标预测软件的交集和调控关系。最新版本发布时间:2013年11月。
2、miRbase
众所周知的microRNA基因注释数据库。目前miRBase只提供了microRNA的靶标的预测软件的链接(如:PicTar)。最新版本发布时间:2010年9月。
3、ChIPBase
整合CLIP-Seq和ChIP-Seq的数据探讨microRNA的转录和转录后调控,构建转录因子->microRNA->靶标的调控网络。最新版本发布时间:2012年11月。
4、Tarbase
一个收集已被实验验证的microRNA靶标数据库。最新版本发布时间:2009年1月。
5、miRecords
一个整合的microRNA靶标数据库。整合多个靶标预测软件的调控关系。最新版本发布时间:2010年11月。
6、targetScan
基于靶mRNA序列的进化保守等特征搜寻动物的microRNA靶基因。是预测microRNA靶标假阳性率较低的软件。而且是microRNA领域大牛Bartel实验室开发的。最新版本发布时间:2009年4月。
7、PicTar
基于microRNA或microRNA靶标联合作用等特征开发的搜寻动物的microRNA靶基因。假阳性率也较低。是microRNA领域大牛Rajewsky实验室开发的。最新版本发布时间:2007年3月。
8、PITA
基于靶位点的可接性和自由能预测microRNA的靶标。是著名的生物信息学家Segal实验室开发的。最新版本发布时间:2008年8月。
9、RNA22
基于序列特征预测microRNA的结合位点。是几个流行的microRNA靶标预测软件的其中一个。IBM公司的研究团队开发的。最新版本发布时间:2007年。
10、miRanda和microRNA.org
是著名的MemorialSloan-Kettering 癌症研究中心的研究人员开发的软件和数据库。miRanda的最新版本又叫mirSVR。最新版本发布时间:2010年8月。
11、MicroCosm
EMBL-EBI的Enright 实验室开发的microRNA靶标数据库。最新版本发布时间:2010年8月。
12、miRTarBase
整合实验证实的microRNA靶标的数据库。最新版本发布时间:2010年10月。
13、miRGator v2.0
整合microRNA表达、靶标和疾病相关信息的数据库。最新版本发布时间:2010年11月。
14、MiRNAMap
动物的microRNA基因及其靶标的数据库。最新版本发布时间:2008年1月。
15、miRDB
动物microRNA靶标预测和功能注释数据库。最新版本发布时间:2010年8月。
16、RNAhybrid
一个基于miRNA-target配对自由能预测microRNA的靶标。最新版本发布时间:2011年6月。
17、miRGen
microRNA基因和microRNA靶标数据库。最新版本发布时间:2007年1月。
基因组注释分析主要包括哪些内容基因组注释包括以下方面的内容:
(1) 重复序列的预测。通过比对已知的重复序列数据库,找出序列中包含的重复序列,识别类型并转化为N或者X,统计各种类型重复序列的分布。
(2) 编码基因的预测。通过将转录组或EST数据比对到拼接后的基因组序列上,找出编码基因位置,预测编码基因结构。或者通过专业的外显子预测,预测编码基因的外显子结构。
(3) 小RNA基因的预测。通过比对已知的小RNA的数据库,或者通过生物信息(bioinformation)学预测,找出这些小RNA基因,并进行分类。
(4) 调控序列和假基因的预测。
基因功能的注释,使用的数据库包括NT/NR, SwissProt/TrEMbl, InterPro, KEGG, COG, Gene ontology等,使用比对的方法,如blast,找出同源相近的基因,并注释功能。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)