Swissprot数据库如何找出蛋白质的相似序列

Swissprot数据库如何找出蛋白质的相似序列,第1张

总的而言有下列12种

0 = pairwise,显示具体匹配信息(缺省)

1 = query-anchored showing identities,查询-比上区域,显示一致性

2 = query-anchored no identities,查询-比上区域,不显示一致性

3 = flat query-anchored, show identities,查询-比上区域的屏文形式,显示一致性

4 = flat query-anchored, no identities,查询-比上区域的屏文形式,不显示一致性

5 = query-anchored no identities and blunt ends,查询-比上区域,不显示一致性,无突然的结束

6 = flat query-anchored, no identities and blunt ends,查询-比上区域的屏文形式,不显示一致性

7 = XML Blast output,XML格式的输出

8 = tabular,TAB格式的输出

9 =tabular with comment lines,带注释行的TAB格式的输出

10 =ASN, text,文本方式的ASN格式输出

11 =ASN, binary [Integer] default = 0,二进制方式的ASN格式输出

但是如果你在网站上进行,一般就为2-5种,如0 = pairwise, 8 = tabular,7 = XML Blast output,看你在哪个站点进行了

PIR数据库按照数据的性质和注释层次分四个不同部分,分别为PIR1、PIR2、PIR3和PIR4。PIR1中的序列已经验证,注释最为详尽;PIR2中包含尚未确定的冗余序列;PIR3中的序列尚未加以检验,也未加注释而PIR4中则包括了其它各种渠道获得的序列,既未验证,也无注释。除了PIR外,另一个重要的蛋白质序列数据库则是SwissProt。该数据库由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所(Swiss Institute of Bioinformatics,简称SIB)和欧洲生物信息学研究所 EBI共同维护和管理。瑞士生物信息研究所下属的蛋白质分析专家系统(Expert Protein Analysis System,,简称ExPASy)的Web服务器除了开发和维护SwissProt数据库外,也是国际上蛋白质组和蛋白质分子模型研究的中心,为用户提供大量蛋白质信息资源。北京大学生物信息中心设有ExPASy的镜象。PIR和SwissProt是创建最早、使用最为广泛的两个蛋白质数据库。随着各种模式生物基因组计划的进展,DNA序列特别是EST序列大量进入核酸序列数据库。蛋白质序列数据库TrEMBL是从EMBL中的cDNA序列翻译得到的。TrEMBL数据库创建是于1996年[Bairoch, 2000],意为“Translation of EMBL”。该数据库采用SwissProt数据库格式,包含EMBL数据库中所有编码序列的翻译。TrEMBL数据库分两部分,SP-TrEMBL和 REM-TrEMBL。SP-TrEMBL中的条目最终将归并到SwissProt数据库中。而Rem-TrEMBL则包括其它剩余序列,包括免疫球蛋白、T细胞受体、少于8个氨基酸残基的小肽、合成序列、专利序列等。与TrEMBL类似,GenPept是由GenBank翻译得到的蛋白质序列。由于TrEMBL和GenPept均是由核酸序列通过计算机程序翻译生成,这两个数据库中的序列错误率较大,均有较大的冗余度。另一个常用的蛋白质序列数据库是已知三维结构蛋白质的一级结构序列数据库NRL-3D[Namboodiri, 1990]。该数据库的序列是从三维结构数据库PDB中提取出来。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6758653.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-27
下一篇 2023-03-27

发表评论

登录后才能评论

评论列表(0条)

保存