SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立
了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。SWISS-PROT数据库包含了EMBL核酸序列数据库中被经过仔细检查和准确注释了
的蛋白质序列,一般地,任何蛋白质序列数据的搜寻和比较都应从SWISS-PROT开始。
SWISS-PROT蛋白质序列数据由大量序列条目组成,每一个序列条目
有其自己的格式。为了标准化的目的,SWISS-PROT的格式与EMBL核酸序列数据库的格式尽可能类似。SWISS-PROT涉及已知蛋白质的序列、
引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关
系、序列变异体和冲突等信息。利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序
获得的蛋白质序列,序列提交可以在其Web页面上完成。
40%比较建模法是基于知识的蛋白质结构预测方法,又称为同源结构预测,是根据大量已知的蛋白质三维结构来预测序列已知而结构未知的蛋白质结构。
按照目前的定义,若待模型构建蛋白质的序列与模板序列经比对( alignment )后的序列同源性( sequence identity )在 40% (也有人认为在 35% )以上,则它们的结构可能属于同一家族,它们是同源蛋白( homology ),可以用同源蛋白模型构建的方法预测其三维结构。因为它们可能是由同一种蛋白质分化而来,它们具有相似的空间结构,相同或相近的功能。因此,若知道了同源蛋白家族中某些蛋白质的结构,就可以预测其它一些序列已知而结构未知的同源蛋白的结构,可以用同源模型构建的方法预测未知蛋白质的三维结构。 常用的数据库是swiss-model和interproscan。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)