常用的查询蛋白质结构以及序列的数据库主要有哪些？_sql

1. PIR和PSD

PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库，可在这里下载。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库，其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理，超过99%的序列已按蛋白质家族分类，一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引，以及数据库内部条目之间的索引，这些内部索引帮助用户在包括复合物、酶－底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库，每周可以得到更新部分。

PSD数据库有几个辅助数据库，如基于超家族的非冗余库等。PIR提供三类序列搜索服务：基于文本的交互式检索；标准的序列相似性搜索，包括BLAST、FASTA等；结合序列相似性、注释信息和蛋白质家族信息的高级搜索，包括按注释分类的相似性搜索、结构域搜索GeneFIND等。

2. SWISS-PROT

SWISS-PROT是经过注释的蛋白质序列数据库，由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成，每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等，注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列，并与其它30多个数据建立了交叉引用，其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。

利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列，序列提交可以在其Web页面上完成。

3. PROSITE

PROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式，并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下，某个蛋白质与已知功能蛋白质的整体序列相似性很低，但由于功能的需要保留了与功能密切相关的序列模式，这样就可能通过PROSITE的搜索找到隐含的功能motif，因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等；除了序列模式之外，PROSITE还包括由多序列比对构建的profile，能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。

4. PDB

蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库，由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据，经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务，以及关于PDB数据文件格式和其它文档的说明，PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。

5. SCOP

蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次：家族，描述相近的进化关系；超家族，描述远源的进化关系；折叠子(fold)，描述空间几何结构的关系；折叠类，所有折叠子被归于全α、全β、α/β、α＋β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库，这个库通常被用来评估各种序列比对算法。此外，SCOP还提供一个PDB-ISL中介序列库，通过与这个库中序列的两两比对，可以找到与未知结构序列远缘的已知结构序列。

6. COG

蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白，根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序，可以把某个蛋白质与所有COGs中的蛋白质进行比对，并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询，基于Web的COGNITOR服务，系统进化模式的查询服务等。

1.细胞核有无。真核生物有双层膜包围的细胞核，原核生物只有DNA分子集中的核区或称拟核，无膜包裹。 2.细胞壁成分。真核生物有以纤维素和果胶质为主的细胞壁（植物），以葡聚糖和甘露聚糖为主的细胞壁（酵母），以几丁质为主的细胞壁（多细胞真菌）或无细胞壁（动物、黏菌），原核生物有肽聚糖为主的细胞壁（细菌、放线菌）或无细胞壁（支原体）。 3.细胞膜成分。真核生物细胞膜含固醇，原核生物除支原体外细胞膜中均无固醇。 4.DNA形态。真核生物基因组DNA为线性，分裂间期为30nm螺线管，分裂期高度盘绕成染色体。原核生物基因组为一高度盘绕的环状超螺旋DNA。 5.DNA结合蛋白。真核生物DNA与组蛋白结合，形成核小体结构。原核生物DNA裸露。 6.基因结构。真核生物基因中存在大量内含子等非编码区。原核生物无。 7.基因表达。真核生物的RNA转录本为单顺反子，必须经过加工切除内含子，成为mRNA进入胞质后才能翻译。原核生物的RNA转录本直接作为mRNA，为多顺反子，可以边转录边翻译。 8.蛋白质修饰。真核生物的蛋白存在糖基化修饰。原核生物无。 9.细胞质基质形态。真核生物细胞质基质中有细胞骨架，能流动。原核生物基质无细胞骨架，不流动。 10.细胞器形态。真核生物细胞有多种以单位膜包裹的细胞器，有复杂的内膜系统（内质网、高尔基体等）。原核生物只有核糖体一种细胞器，无内膜系统。 11.细胞分裂方式。真核生物为有丝分裂、减数分裂和无丝分裂。原核生物为简单二分裂。 12.细胞分化。真核生物除单细胞和少数多细胞群体外均有。原核生物均无，全部为单细胞或群体。 13.有性生殖。真核生物绝大部分行有性生殖。原核生物为无性生殖。

氨基酸在核糖体上缩合成多肽链是通过核糖体循环而实现的。此循环可分为肽链合成的起始(intiation)，肽链的延伸(elongation)和肽链合成的终止三个主要过程。原核细胞的蛋白质合成过程以E.coli细胞为例。

1.肽链合成的起始

1.三元复合物的形成。核糖体30S小亚基附着于mRNA的起始信号部位，该结合反应是由起始因子3(IF3)介导的，另外有Mg2+的参与。故形成IF3-30S亚基-mRNA三元复合物。

2.30S前起始复合物的形成。在起始因子2(IF2)的作用下，甲酰蛋氨酸-起始型tRNA(fMet-tRNA Met)与mRNA分子中的起始密码子(AUG或GUG)相结合，即密码子与反密码子相互反应。同时IF3从三元复合物脱落，形成30S前起始复合物，即IF2-30S亚基-mRNA-fMet-tRNAMef复合物。此步亦需要fGTP和Mg2+参与。

3.70S起始复合物形成。50S亚基与上述的30S前起始复合物结合，同时IF2脱落，形成70S起始复合物，即30S亚基-mRNA-50S亚基-fMer-tRNA Met复合物。此时fMet-tRNA Met占据着50S亚基的肽酰位（peptidyl site，简称为P位或给位），而50S的氨基酰位（aminoacyl site，简称为A位或受位）暂为空位。原核细胞蛋白质合成的起始过程氨基酸活化（fMet-tRNAMet形成）

2.肽链合成的延长

这一过程包括进位、肽键形成、脱落和移位等四个步骤。肽链合成的延长需两种延长因子(Elongationfactor，简写为EF），分别称为EF-T和EF-G.此外尚需GTP供能加速翻译过程。

1.进位即新的氨基酰-tRNA进入50S大亚基A位，并与mRNA分子上相应的密码子结合.在70S起始复合物的基础上，原来结合在mRNA上的fMet-tRNAMet占据着50S亚基的P位点(当延长步骤循环进行二次以上时，在P位点则为肽酰-tRNA)新进入的氨基酰-tRNA则结合到大亚基的A位点，并与mRNA上起始密码子随后的第二个密码子结合。此步需GTP、EF-T及Mg2+的参与。

2.肽键形成在大亚基上肽酰转移酶(见第四章)的催化下，将P位点上的tRNA所携带的甲酰蛋氨酰(或肽酰基)转移给A位上新进入的氨基酰-tRNA的氨基酸上，即由P位上的氨基

酸(或肽的3'端氨基酸)提供α-COOH基，与A位上的氨基酸的α-NH2基形成肽链。此后，在P位点上的tRNA成为无负载的tRNA，而A位上的tRNA负载的是二肽酰基或多肽酰基。此步需Mg2+及K+的存在。

3.脱落即50S亚基P位上无负载的tRNA(如tRNAMet)脱落。

4.移位指在EF-G和GTP的作用下，核糖体沿mRNA链(5'→3')作相对移动。每次移动相当于一个密码子的距离，使得下一个密码子能准确的定位于A位点处。与此同时，原来处于A位点上的二肽酰tRNA转移到P位点上，空出A位点。随后再依次按上述的进位、肽键形成和脱落步骤进行下一循环，即第三个氨基酰-tRNA进入A位点，然后在肽酰转移酶催化下，P位上的二肽酰tRNA又将此二肽基转移给第三个氨基酰-tRNA，形成三肽酰tRNA。同时，卸下二肽酰的tRNA又迅速从核糖体脱落。像这样继续下去，延长过程每重复一次，肽链就延伸一个氨基酸残基。多次重复，就使肽链不断地延长，直到增长到必要的长度。通过实验已经证明，mRNA上的信息的阅读是从多核苷酸链的5'端向3'端进行的，而肽链的延伸是从N端开始的。?

3.肽链合成的终止，需终止因子或释放因子(releasing factor简写为RF)参与。在E.coli中已分离出三种RF:RF1(MW36000)，RF2(MW38000和RF3(MW46000)。其中，只有RF3与GTP(或GDP)能结合。它们均具有识别mRNA链上终止密码子的作用，使肽链释放，核糖体解聚。

1.多肽链的合成已经完毕，这时，虽然多肽链仍然附着在核蛋白体及tRNA上，但mRNA上肽链合成终止密码子UAA(亦可以是UAG或UGA)已在核蛋白体的A位点上出现。终止因子用以识别这些密码子，并在A位点上与终止密码子相结合，从而阻止肽链的继续延伸。RF3的作用还不能肯定，可能具有加强RF1和RF2的终止作用。RF1和RF2对终止密码子的识别具有一定特异性，RF1可识别UAA和UAG，RF2识别UAA和UGA。RF与EF在核糖体上的结合部位是同一处，它们重叠的结合部位与防止了EF与F同时结合于核糖体上，而扰乱正常功能。

2.终止因子可能还可以使核蛋白体P位点上的肽酰转移酶发生变构，酶的活性从转肽作用改变为水解作用，从而使tRNA所携带的多肽链与tRNA之间的酯键被水解切断，多肽链从核蛋白体及tRNA释放出来。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/sjk/9956038.html

常用的查询蛋白质结构以及序列的数据库主要有哪些？

发表评论

评论列表（0条）