总结蛋白质序列数据库演变的过程?

总结蛋白质序列数据库演变的过程?,第1张

蛋白质序列数据库指应用计算机功能分析生物学信息的数据库。应用计算机的运算法则,比较DNA和蛋白质序列而检测结构、功能和序列之间的进化关系。

各种基因组的序列产生大量的DNA序列数据和生物信息,已经被应用于研究基因的功能,预测以前未知的基因功能。现在人们的注意力主要集中在从仅有的氨基酸序列预测蛋白质结构和功能。

历史追溯:

由于蛋白质序列测定技术先于DNA序列测定技术问世,蛋白质序列的搜集也早于DNA序列。蛋白质序列数据库的雏形可以追溯到60年代。60年代中期到80年代初,美国国家生物医学研究基金会(National Biomedical Research Foundation,简称NBRF)。

Dayhoff领导的研究组将搜集到的蛋白质序列和结构信息以“蛋白质序列和结构地图集”(Atlas of Protein Sequence and Structure)的形式发表,主要用来研究蛋白质的进化关系。1984年,“蛋白质信息资源”(Protein Information Resource,简称PIR)计划正式启动。

蛋白质序列数据库PIR也因此而诞生。与核酸序列数据库的国际合作相呼应,1988年,美国的NBRF、日本的国际蛋白质信息数据库(Japanese International Protein Information Database,简称JIPID)。

德国的慕尼黑蛋白质序列信息中心(Munich Information Center for Protein Sequences,简称MIPS)合作成立了国际蛋白质信息中心(PIR-International),共同收集和维护蛋白质序列数据库PIR,[Barker等, 2000]。

SWISS-PROT是含有详细注释内容的蛋白质序列数据库,由欧洲生物信息学中心(EBI)维护,目前已合并入 UniProt数据库,旨在帮助基因组和蛋白质组以及相关的分子生物学研究人员提供有关蛋白质氨基酸序列的最新信息。

SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立

了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。SWISS-PROT数据库包含了EMBL核酸序列数据库中被经过仔细检查和准确注释了

的蛋白质序列,一般地,任何蛋白质序列数据的搜寻和比较都应从SWISS-PROT开始。

SWISS-PROT蛋白质序列数据由大量序列条目组成,每一个序列条目

有其自己的格式。为了标准化的目的,SWISS-PROT的格式与EMBL核酸序列数据库的格式尽可能类似。SWISS-PROT涉及已知蛋白质的序列、

引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关

系、序列变异体和冲突等信息。利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序

获得的蛋白质序列,序列提交可以在其Web页面上完成。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6672354.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-26
下一篇 2023-03-26

发表评论

登录后才能评论

评论列表(0条)

保存