蛋白质简介

蛋白质简介,第1张

目录 1 拼音 2 英文参考 3 概述 4 历史 5 蛋白的生物化学性质 6 蛋白质的分类 7 蛋白质的功能 71 催化作用 72 信号传导和配基运输 73 营养作用 8 人体蛋白质的生理功能 81 构成和修补人体组织 82 构成酶和激素 83 构成抗体 84 调节渗透压 85 供给热能 9 人体蛋白质的生理价值 10 蛋白质组学与生物信息学 11 蛋白质的结构预测与模拟 12 外部链结 13 参考资料 1 拼音

dàn bái zhì

2 英文参考

protein [WS/T 476—2015 营养名词术语]

3 概述

蛋白质(protein)是以氨基酸为基本单位,通过肽键连接起来的一类含氮大分子有机化合物[1]。蛋白质是人体必需的营养素[2]。

蛋白质是一种复杂的有机化合物,有些情况下可以用“朊”字来指代蛋白质[3]。蛋白质是由氨基酸分子呈线性排列所形成,相邻氨基酸残基的羧基和氨基通过形成肽键连接在一起。蛋白质的氨基酸序列是由对应基因所编码。除了遗传密码所编码的20种“标准”氨基酸,在蛋白质中,某些氨基酸残基还可以被翻译后修饰而发生化学结构的变化,从而对蛋白质进行激活或调控。多个蛋白质可以一起,往往是通过结合在一起形成稳定的蛋白质复合物,发挥某一特定功能。

蛋白质是动物、植物和微生物等生物细胞的主要成分,是一类高分子含氮的有机化合物的总称。蛋白质是活细胞的组成成分,也是作为维持细胞生活的活性物质(如酶等),与生命现象密切相关的物质,它在体内不断地进行代谢循环,而在外观上似乎保持着恒定状态。蛋白质是由各种Lα氨基酸类(H2N-CHR-COOH,RH即甘氨酸)彼此返复以肽键(……CO-NH……)结合而形成的多肽链(H2N-CHR1-CO-NH-CHR2-CO-NHR3-CO……)。由于蛋白质种类的不同,其所含氨基酸的种类、数量及其结合顺序都不相同,其分子的大小是多种多样的。从鲱鱼和鲑的 蛋白的鱼精蛋白分子量为4千左右直到病毒类那种具有复杂的四级结构的分子量至数亿。对水解后仅生成氨基酸的天然蛋白质称为单纯蛋白质。对水解后除产生氨基酸外,还有其他有机物质的称为结合蛋白质。前者根据溶解度与其来源而分别称为清蛋白、球蛋白、醇溶谷蛋白、谷蛋白、硬蛋白、组蛋白、鱼精蛋白。后者依其所含有的非氨基酸有机物而分别称为核蛋白质、糖蛋白、核糖蛋白、磷脂蛋白、色素蛋白等。此外虽然不是天然蛋白质,但多少进行变化而产生的一族衍生蛋白质则有:白明胶、胨、等。除硬蛋白质外,蛋白质溶于水或稀盐溶液而形成胶体溶液,蛋白质溶液可通过加入醇、丙酮等有机溶剂、硫酸铵等中性盐和三氯醋酸、硫柳酸、生物堿试剂、重金属盐等而使蛋白质沉淀,因此可用来对蛋白质的检出、去除和提纯。为了检出蛋白质和蛋白质中含有的氨基酸,可用双缩脲反应、米伦(Millon′s)反应、**蛋白反应、阿达姆凯威斯(adam-kiewiez)反应、李伯曼(Libermann)反应、毛利斯(Molis-ch)反应等各种显色反应。为了正确分析组成蛋白质的氨基酸的种类和数量,通常可以将样品加入过量的6N盐酸于闭式管中,在110℃下处理约2472小时,然后将水解产物放入以离子交换柱为主体的氨基酸自动分析仪中进行测定。蛋白质中氨基酸的组成和分子内氨基酸的排列顺序,对每种生物和器官都各显有其特征。也就是说蛋白质具有种属和器官的特异性。天然蛋白质是不稳定的物质,因各种物理的(加热、搅拌、薄膜化、紫外线及X线照射等)或化学的(尿素、有机溶剂酸、醇及数种盐类处理等)原因而引起变性。通常,一般的天然蛋白质一旦注入与其不同的动物组织内,便会成为所谓的抗原,在注射过的动物血清中会形成免疫球蛋白,它能和注射蛋白之间引起特异性的抗原抗体反应。因此可利用这种性质用微量(样品)就能判断出两种蛋白质的同一性。

与其他生物大分子(如多糖和核酸)一样,蛋白质是生物体中的必要组成成分,参与了细胞生命活动的每一个进程。酶是最常见的一类蛋白质,它们催化生物化学反应,尤其对于生物体的代谢至关重要。除了酶之外,还有许多结构性或机械性蛋白质,如肌肉中的肌动蛋白和肌球蛋白,以及细胞骨架中的微管蛋白(参与形成细胞内的支撑网络以维持细胞外形)。另外一些蛋白质则参与细胞信号传导、免疫反应、细胞黏附和细胞周期调控等。同时,蛋白质也是人们日常饮食中必需的营养物质,这是因为动物自身无法合成所有必需氨基酸;通过消化所摄入的蛋白质食物(将蛋白质降解为氨基酸),人体就可以将吸收的氨基酸用于自身的蛋白质合成。

蛋白质这一概念最早是由瑞典化学家永斯·贝采利乌斯于1838年提出,但当时人们对于蛋白质在机体中的核心作用并不了解。1926年,詹姆斯·B·萨姆纳揭示尿素酶是蛋白质,首次证明了酶是蛋白质。

第一个被测序的蛋白质是胰岛素,由弗雷德里克·桑格完成,他也因此获得1958年度的诺贝尔化学奖。首先被解析的蛋白质结构包括血红蛋白和肌红蛋白的结构,所用方法为X射线晶体学;

该工作由马克斯·佩鲁茨和约翰·肯德鲁于1958年分别完成,他们也因此获得1962年度的诺贝尔化学奖。

4 历史

在18世纪,安东尼奥·弗朗索瓦(Antoine Fourcroy)和其他一些研究者发现蛋白质是一类独特的生物分子,他们发现用酸处理一些分子能够使其凝结或絮凝。当时他们注意到的例子有来自蛋清、血液、血清白蛋白、纤维素和小麦面筋里的蛋白质。荷兰化学家Gerhardus Johannes Mulder对一般的蛋白质进行元素分析发现几乎所有的蛋白质都有相同的实验公式。用“蛋白质”这一名词来描述这类分子是由Mulder的合作者永斯·贝采利乌斯于1838年提出。Mulder随后鉴定出蛋白质的降解产物,并发现其中含有为氨基酸的亮氨酸,并且得到它(非常接近正确值)的分子量为131Da。

对于早期的生物化学家来说,研究蛋白质的困难在于难以纯化大量的蛋白质以用于研究。因此,早期的研究工作集中于能够容易地纯化的蛋白质,如血液、蛋清、各种毒素中的蛋白质以及消化性和代谢酶(获取自屠宰场)。1950年代后期,Armour Hot Dog Co公司纯化了一公斤纯的牛胰腺中的核糖核酸酶A,并免费提供给全世界科学家使用。目前,科学家可以从生物公司购买越来越多的各类纯蛋白质。

著名化学家莱纳斯·鲍林成功地预测了基于氢键的规则蛋白质二级结构,而这一构想最早是由威廉·阿斯特伯里于1933年提出。随后,Walter Kauzman在总结自己对变性的研究成果和之前Kaj LinderstromLang的研究工作的基础上,提出了蛋白质折迭是由疏水相互作用所介导的。1949年,弗雷德里克·桑格首次正确地测定了胰岛素的氨基酸序列,并验证了蛋白质是由氨基酸所形成的线性(不具有分叉或其他形式)多聚体。原子分辨率的蛋白质结构首先在1960年代通过X射线晶体学获得解析;到了1980年代,NMR也被应用于蛋白质结构的解析;近年来,冷冻电子显微学被广泛用于对于超大分子复合体的结构进行解析。截至到2008年2月,蛋白质数据库中已存有接近50,000个原子分辨率的蛋白质及其相关复合物的三维结构的坐标。[4]

5 蛋白质的生物化学性质

细胞色素c的NMR溶液结构,显示了蛋白质的动态结构。

蛋白质并不完全是刚性分子。许多蛋白质在执行生物学功能时可以在多个相关结构中相互转换。在进行功能型结构重排时,这些相关的三级或四级结构通常被定义为不同“构象”,而这些结构之间的转换就被称为“构象变换”。例如,酶的构象变换常常是由底物结合到活性位点所导致。在溶液中,所有的蛋白质都会发生结构上的动态变化,主要表现为热振动和与其他分子之间碰撞所导致的运动。

不同大小的蛋白质的分子表面。从左到右依次为:抗体(IgG)、血红蛋白、胰岛素、腺苷酸激酶和谷胺酰氨合成酶。

蛋白质可以由三级结构的不同大致分为三个主要类别:球蛋白、纤维蛋白和膜蛋白。几乎所有的球蛋白都是水溶性的,许多酶都是球蛋白;纤维蛋白多为结构蛋白;膜蛋白常常作为受体或分子通道,是细胞与外界联系的重要介质。

要了解特定蛋白质的功能,获得其三级结构或四级结构可以提供重要的结构信息。目前用于蛋白质的原子分辨率结构测定的方法主要是X射线晶体学和NMR光谱学。冷冻电子显微学也可以提供超大蛋白质复合物(如病毒、核糖体等)的低分辨率结构信息。[5]而电子晶体学在一些情况下也可以提供较高分辨率的结构信息,特别是对于膜蛋白的二维晶体。[6]解析的结构(包括原子坐标和结构解析的相关信息)通常存放到蛋白质数据库(PDB),供全世界研究者免费。结构预测也可以为未知结构(实验结构)的蛋白质提供结构信息。

6 蛋白质的分类

[7]

蛋白质是生命的存在形式,是维持生命的物质基础。人体的一切细胞组织都是由蛋白质组成的,蛋白质占人体重的15%。

根据所含的氨基酸种类齐全与否,营养学把蛋白质分为三大类:完全蛋白质、半完全蛋白质、不完全蛋白质。

(1)完全蛋白质

完全蛋白质含有种类齐全的必需氨基酸,数量充足,比例也较适当,可以满足人体的需要。属于完全蛋白质的有酪蛋白、乳白蛋白、卵白蛋白、卵黄磷蛋白、白蛋白、肌蛋白、大豆蛋白、麦谷蛋白、谷蛋白等。完全蛋白质营养价值高,是高质量的蛋白质。

(2)半完全蛋白质

半完全蛋白质含有各种必需的氨基酸,在种类上是齐全的,但是含量多寡不齐,比例不当,不能完全满足人体的需要。如小麦、大麦中的麦胶蛋白。

(3)不完全蛋白质

不完全蛋白质所含必需氨基酸种类不全,不能满足人体的需要,如玉米胶蛋白、动物结缔组织、胶质蛋白、豆球蛋白等。

蛋白质又可分为单纯蛋白质和结合蛋白质。单纯蛋白质由氨基酸及其衍生物组成,如血清白蛋白、胰岛素等,成分相对比较简单;结合蛋白质是由单纯蛋白质和某些非蛋白质化合物基团所组成。

根据蛋白质在人体内的作用,又可以分为6类:结构蛋白、收缩蛋白、抗体蛋白、血液蛋白、激素蛋白、酶蛋白。

蛋白质可以由三级结构的不同大致分为三个主要类别:球蛋白、纤维蛋白和膜蛋白。几乎所有的球蛋白都是水溶性的,许多酶都是球蛋白;纤维蛋白多为结构蛋白;膜蛋白常常作为受体或分子通道,是细胞与外界联系的重要介质。

7 蛋白质的功能

蛋白质是细胞中的主要功能分子。[8]除了特定类别的RNA,大多数的其他生物分子都需要蛋白质来调控。蛋白质也是细胞中含量最为丰富的分子之一;例如,蛋白质占大肠杆菌细胞干重的一半,而其他大分子如DNA和RNA则只分别占3%和20%。[16]在一个特定细胞或细胞类型中表达的所有蛋白被称为对应细胞的蛋白质组。

蛋白质能够在细胞中发挥多种多样的功能,涵盖了细胞生命活动的各个方面:发挥催化作用的酶;参与生物体内的新陈代谢的调剂作用,如胰岛素;一些蛋白质具有运输代谢物质的作用,如离子泵和血红蛋白;发挥储存作用,如植物种子中的大量蛋白质,就是用来萌发时的储备;许多结构蛋白被用于细胞骨架等的形成,如肌球蛋白;还有免疫、细胞分化、细胞凋亡等过程中都有大量蛋白质参与。

蛋白质功能发挥的关键在于能够特异性地并且以不同的亲和力与其他各类分子,包括蛋白质分子结合。蛋白质结合其他分子的区域被称为结合位点,而结合位点常常是从蛋白质分子表面下陷的一个“口袋”;而结合能力与蛋白质的三级结构密切相关,因为结构决定了结合位点的形状和化学性质(即结合位点周围的氨基酸残基的侧链的化学性质)。蛋白质结合的紧密性和特异性可以非常高;例如,核糖核酸酶抑制蛋白可以与人的血管促生蛋白angiogenin以亚飞摩尔(subfemtomolar,即<1015M)量级的解离常数进行结合,[17]但却完全不结合(解离常数>1 M)angiogenin在两栖动物中的同源蛋白抗肿瘤核糖核酸酶(onconase)。非常微小的化学结构变化,如在结合位点的某一残基侧链上添加一个甲基基团,有时就可以几乎完全破坏结合;例如,氨酰tRNA合成酶可以分辨侧链结构非常类似的缬氨酸和异亮氨酸,而这两种氨基酸的差别就在于异亮氨酸的侧链多出一个甲基。相同的蛋白质分子结合在一起就可形成同源寡聚体或多聚体,有些多聚体可以形成纤维;而这些形成纤维的蛋白质往往是结构蛋白,它们在单体状态下是球蛋白,通过自结合来形成刚性的纤维。蛋白蛋白相互作用可以调控酶的活性和细胞周期中的各种进程,并可以使大型的蛋白质复合物得以形成,这样可以将参与同一生物学功能的分子结合到一起,从而提高其工作效率;而结合所诱导的蛋白构象变化对于复杂的信号传导网络的构建也是必不可少的。还有一些蛋白质(如膜蛋白)可以结合或者插入到细胞膜中。

71 催化作用

细胞中,酶是最被广泛了解和研究最多的蛋白质,它的特点是催化细胞中的各类化学反应。酶的催化反应具有高度的专一性和极高的催化效率。酶在大多数与代谢和异化作用以及DNA的复制、修复和RNA合成等相关的反应中发挥作用。在翻译后修饰作用中,一些酶(如激酶和磷酸酶)可以在其底物蛋白质上增加或去除特定化学基团(如磷酸基团)。目前已知的酶催化的反应有约4000种。[18]酶可以极大地加速其所催化的反应;例如,与没有酶催化的情况相比,乳清酸核苷5'单磷酸脱羧酶(orotate decarboxylase)的加速作用最高可达1017倍(形象地说,在没有酶的情况下完成反应需要七千八百万年,而存在酶的情况下反应只需18毫秒)。[19]

结合于酶上,并在酶的作用下发生反应的分子被称为底物。虽然酶分子通常含有数百个氨基酸残基,但参与与底物结合的残基只占其中的一小部分,而直接参与底物催化反应的残基则更少(平均为34个残基)。[20]这部分参与底物结合和催化的区域被称为活性位点。有一些酶需要结合一些小分子(辅酶或辅因子)才能够有效发挥催化作用。酶的活性还可以被酶抑制剂所抑制,或被酶激活剂所提高。

72 信号传导和配基运输

带有绿色荧光蛋白标签的蛋白质在不同的细胞区室和细胞结构中的分布图。荧光以白色来显示。左边从上到下依次为,细胞核、内质网、质膜和线粒体;中间从上到下依次为,核小体、高尔基体、细胞质和微管;右边从上到下依次为,核膜、溶酶体、中心体和微丝。

in vivo的蛋白质研究常常专注于蛋白质在细胞中的合成和定位。虽然已经知道许多细胞内蛋白质是在细胞质中合成,而膜结合蛋白质或分泌性蛋白质是在内质网中合成,但蛋白质定位到特定细胞器或细胞结构的特异性是如何达到的,目前还不清楚。一些有助于获得特定蛋白质在细胞中定位的方法得到了发展,特别是用基因工程将目的蛋白质上连接上“报告者”(如绿色荧光蛋白),将这样的融合蛋白在细胞中表达后,就可以通过显微镜观察荧光来了解融合蛋白在细胞中的分布。

另一种常用的同样是基因工程的方法为定点突变。利用这一方法,研究者可以改变蛋白质序列,从而改变其结构、细胞内定位以及调控机制;而这些改变可以在in vivo的情况下通过连接绿色荧光蛋白,或者在in vitro的情况下通过酶动力学的方法以及结合实验进行观察。

73 营养作用

构成蛋白质的基本单位是氨基酸,许多氨基酸按不同的方式连结,就成为品种繁多的蛋白质[2]。

大多数微生物和植物能够合成所有20种标准氨基酸;动物则由于缺乏某些氨基酸合成途径中特定氨基酸合成反应所需的关键酶,如从天冬氨酸生成赖氨酸、甲硫氨酸和苏氨酸的合成反应第一步中发挥催化作用的天冬氨酸激酶,而只能合成部分氨基酸。因此,动物必须从食物中获取这些自身无法合成的氨基酸。一个生物体所无法合成而需从食物中获取的氨基酸被称为必需氨基酸。如果环境中存在所需氨基酸,微生物能够直接摄取这些氨基酸,而下调其自身的合成水平,从而节省了原来需要用于合成反应的能量。

动物所摄取的氨基酸来源于食物中所含的蛋白质。摄入的蛋白质通过消化作用而被降解,这一过程通常包括蛋白质在消化系统的酸性环境下发生变性,变性后的蛋白质被蛋白酶水解成氨基酸或小段的肽。随后这些降解片断就可以被吸收。部分吸收后的氨基酸被用于蛋白质的合成,其余的则通过糖异生作用被转化为葡萄糖或进入三羧酸循环进行代谢。蛋白质的营养作用在饥饿环境下显得特别重要,此时机体可以利用自身的蛋白质,特别是肌肉中的蛋白质,来产生能量以维持生命活动。蛋白质/氨基酸也是食物中重要的氮源

人体所需蛋白质在许多食物中都含量丰富,如动物肌肉、乳制品、蛋、豆类、榖类和蕈类等。人体中蛋白质缺乏可以导致全身浮肿、皮肤干燥病变、头发稀疏脱色、肌肉重量减轻、免疫力下降等。

食物中的蛋白质有时会引起过敏反应。

食物蛋白质中含有21种氨基酸,分为必须氨基酸和非必需氨基酸两大类。必需氨基酸人体内不能自行合成,或合成数量难以满足需要,必需由食物蛋白质供给,对成人来说,必需氨基酸有8种,对儿童来说,必需氨基酸有10种,这就是异亮氨酸、亮氨酸、赖氨散、蛋氨酸、苯丙氨酸、色氨酸、苏氨酸,缬氨酸(儿童还包括组氨酸和精氨酸)。非必需氨基酸人体内可自行合成,可满足身体需要,包括甘氨酸、脯氨酸、丙氨酸、羟脯氨酸、谷氨酸、门冬氨酸、组氨酸、精氨酸、酪氨酸、羟谷氨酸、胱氨酸、丝氨酸、半脱氨酸。[2]

8 人体蛋白质的生理功能

蛋白质是生命的存在形式,是维持生命的物质基础。人体的一切细胞组织都是由蛋白质组成的,蛋白质占人体重的15%。蛋白质的主要生理功能是[2]:

81 构成和修补人体组织

蛋白质是构成和修补人体组织的“建筑材料”,人体内的神经、肌肉、内脏、血液、骨骼甚至指甲、毛发,都含有蛋白质,身体的生长发育、衰老组织的更新、损伤组织的修补都需要蛋白质的供应。

82 构成酶和激素

人体内发生的化学变化有成千上万种,形成了人体的新陈代谢,而这些化学变化大多需要酶的催化。酶广泛参加入体的各种生命活动,如肌肉收缩、血液循环、呼吸、消化、神经传导、感觉、思维、生育等,如果没有酶的参加,生命活动就无法正常进行,而酶的主要成分正是蛋白质。

激素是人体内分泌腺分泌的物质,直接进入血液分布到全身,对肌体的代谢、生长、发育、繁殖起重要的调节作用,如甲状腺素、肾上腺素、胰岛素等。激素也是由蛋白质构成。

83 构成抗体

抗体是一种蛋白质,其功能是“抵抗”细菌和病毒等外来蛋白质的入侵,保护人体不受侵害,如用于治癌的干扰素。

84 调节渗透压

正常人血液与组织液之间存在着水分的交换,靠血浆和组织液中的电解质和胶体蛋白来保持平衡。当组织液与血浆中的电解质浓度相等时,两者间的水分分布就取决于血浆中血蛋白的浓度。长期缺乏蛋白质的人,其血浆蛋白含量便会降低,血液内的水分就渗入周围组织,造成营养不良性水肿。

85 供给热能

在体脂耗尽的情况下,人体会以蛋白质为“燃料”作为热能。

9 人体蛋白质的生理价值

蛋白质的生理价值是评定食物蛋白营养价值的常用方法,其数值是蛋白质在体内保留量与吸收量的百分比,即[2]:

粪便中排出的蛋白质,为摄入而不被吸收的部分:尿中排出的蛋白质,为吸收而未被利用部分。一般以测量粪、尿中含氮量来换算。[2]

蛋白质的生理价值越高,说明在体内的利用率越高,但实际上没有达到100的。常见食物中,鸡蛋的生理价值最高,达到94,牛奶为85,猪肉74,牛肉76,羊肉69,鱼肉83,大豆64,大米77,小麦67,玉米60,花生59。[2]

蛋白质生理价值的高低,取决于其所含氨基酸的组成。食物中所含氮基酸的成分和比例越接近于人体需要,其生理价值就越高,反之,就越低。为了提高蛋白质的生理价值,可以把两种或两种以上蛋白质混合食用,使其中所含氨基酸互为补充,尽量接近人体需要的种类和比例。如大豆和玉米混合食用、动植物蛋白混合食用,这样可以取长补短,提高生理价值。一般来说,搭配的种类越多越好。[2]

人体体表面积计算器 BMI指数计算及评价 女性安全期计算器 预产期计算器 孕期体重增长正常值 孕期用药安全性分级(FDA) 五行八字 成人血压评价 体温水平评价 糖尿病饮食建议 临床生化常用单位换算 基础代谢率计算 补钠计算器 补铁计算器 处方常用拉丁文缩写速查 药代动力学常用符号速查 有效血浆渗透压计算器 乙醇摄入量计算器

医学百科,马上计算!

10 蛋白质组学与生物信息学

在一定时间内一个细胞或一类细胞中存在的所有蛋白质被称为蛋白质组,研究如此大规模的数据的领域就被称为蛋白质组学,与基因组学的命名方式相似。蛋白质组学中关键的实验技术包括用于检测细胞中大量种类蛋白质相对水平的蛋白质微阵列技术,和用于系统性研究蛋白蛋白相互作用的双杂交筛选技术。此外,还有探究所有组分之间的可能的生物学相互作用的相互作用组学,以及系统性地解析蛋白质结构,并揭示其中的可能的折迭类型的结构基因组学。

目前各类数据库中含有许多种类的生物体的大量的基因组和蛋白质组数据,包括人类基因组的数据;要对这些数据进行分析已获得有用的信息,就需要用到近来来发展起来的新兴学科──生物信息学。生物信息学的发展使得现在研究者可以通过序列比对有效地鉴定相关生物体的同源蛋白质。利用序列信息推导工具(sequence profiling tool)可以对更特异地对序列进行分析,如限制酶图谱、针对核酸序列的开放阅读框架分析以及二级结构预测。利用特定软件,如ClustalW,可以从序列信息中可以构造出系统树并进行进化分析。生物信息学的研究领域包括集合、注释和分析基因组和蛋白质组数据,这就需要应用计算技术于生物学问题,如基因识别和支序分类。

11 蛋白质的结构预测与模拟

作为结构基因组研究的互补,蛋白质结构预测的目标是发展出有效的能够提供未知结构(未通过实验方法得到)蛋白质的可信的结构模型。目前最为成功的结构预测方法是同源建模;这一方法是利用序列相似的蛋白质(已知结构)的结构作为“模板”。而结构基因组的目标正是通过解析大量蛋白质的结构来为同源建模提供足够的模板以获得剩余的未解析的同源蛋白结构。从序列相似性较差的模板计算出精确的结构模型对于同源建模法还是一个挑战,问题在于序列比对准确性的影响,如果能够获得“完美”的比对结果,则能够获得精确的结构模型。[28]许多结构预测方法已经被用于在蛋白质工程领域,在这些方法的帮助下,研究者们设计出一些新型的蛋白质折迭类型。更为复杂的结构计算是预测蛋白质分子之间的相互作用,需要应用分子对接法和蛋白蛋白相互作用预测。

利用分子动力学的方法可以模拟蛋白质的折迭和结合过程。通过分布式计算,如Folding@Home计划,为分子动力学模拟注入了活力。小的α螺旋蛋白结构域,如villin的头部和HIV辅助蛋白已经成功地在计算机中(in silico)被模拟。将分子动力学和量子力学相结合的方法已经被用于探索视网膜色素分子的电子态

12 外部链结

(英文)蛋白质数据库(The Protein Databank)

(英文)UniProt蛋白质资源

(英文)Human Protein Atlas

(英文)iHOP Information Hyperlinked over Proteins

(英文)NCBI Entrez的蛋白质数据库

(英文)NCBI的蛋白质结构数据库

(英文)人类蛋白质参考数据库

(英文)人类蛋白质百科

(英文)斯坦福大学的Folding@Home

(英文)Proteins: Biogenesis to Degradation The Virtual Library of Biochemistry and Cell Biology

你好,很高兴回答你的问题。首先可以根据序列blast查到对应的蛋白名或者基因名,然后在PDB数据库中搜索,网址如下:>

生物大分子三维空间结构数据库是一类重要的生物信息学数据库。蛋白质结构数据库(ProreinData Bank,PDB)是1971年创建的国际上最著名、最完整的蛋白质三维结构数据库。另外还有蛋白质分类数据库SCOP和CATH。

PDB 是蛋白质复合物的数据库,一个pdb id 往往代表多个蛋白质形成的复合物,或者蛋白质与小分子形成的复合物。而uniprot是蛋白质数据库,一个id就代表一个蛋白质。

考虑到一个蛋白质可能与多个其他蛋白或者小分子组合,因此,不同的pdb中会包含相同的蛋白质,也就是说一个uniprot id会对应多个pdb id

如果该基因编码的蛋白质在PDB数据库里有ID,基因注释里要有PDB id的。基因名字中一般不能用PDB数据库编号的,基因名字有自己通用的命名法则,可以和蛋白质名字类似或大小写的区别。

所以,NCBI数据库中的基因名字一般情况下不可以是蛋白质的PDBID。

基因是基因,蛋白质是蛋白质,基因名字和蛋白质名字不是一回事。NCBI数据库是一个超级大的数据仓库,里面有蛋白质数据库、蛋白质结构数据库、基因序列数据库、基因组序列数据库、蛋白质表达及基因芯片数据库等等,种类非常多。

PIR数据库按照数据的性质和注释层次分四个不同部分,分别为PIR1、PIR2、PIR3和PIR4。PIR1中的序列已经验证,注释最为详尽;PIR2中包含尚未确定的冗余序列;PIR3中的序列尚未加以检验,也未加注释; 而PIR4中则包括了其它各种渠道获得的序列,既未验证,也无注释。除了PIR外,另一个重要的蛋白质序列数据库则是SwissProt。该数据库由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所(Swiss Institute of Bioinformatics,简称SIB)和欧洲生物信息学研究所 EBI共同维护和管理。瑞士生物信息研究所下属的蛋白质分析专家系统(Expert Protein Analysis System,,简称ExPASy)的Web服务器除了开发和维护SwissProt数据库外,也是国际上蛋白质组和蛋白质分子模型研究的中心,为用户提供大量蛋白质信息资源。北京大学生物信息中心设有ExPASy的镜象。PIR和SwissProt是创建最早、使用最为广泛的两个蛋白质数据库。随着各种模式生物基因组计划的进展,DNA序列特别是EST序列大量进入核酸序列数据库。蛋白质序列数据库TrEMBL是从EMBL中的cDNA序列翻译得到的。TrEMBL数据库创建是于1996年[Bairoch, 2000],意为“Translation of EMBL”。该数据库采用SwissProt数据库格式,包含EMBL数据库中所有编码序列的翻译。TrEMBL数据库分两部分,SP-TrEMBL和 REM-TrEMBL。SP-TrEMBL中的条目最终将归并到SwissProt数据库中。而Rem-TrEMBL则包括其它剩余序列,包括免疫球蛋白、T细胞受体、少于8个氨基酸残基的小肽、合成序列、专利序列等。与TrEMBL类似,GenPept是由GenBank翻译得到的蛋白质序列。由于TrEMBL和GenPept均是由核酸序列通过计算机程序翻译生成,这两个数据库中的序列错误率较大,均有较大的冗余度。另一个常用的蛋白质序列数据库是已知三维结构蛋白质的一级结构序列数据库NRL-3D[Namboodiri, 1990]。该数据库的序列是从三维结构数据库PDB中提取出来。

以上就是关于蛋白质简介全部的内容,包括:蛋白质简介、实验中获得一条由250个氨基酸组成的蛋白质的序列。想了解该蛋白质的三维结构是否已知。该如何寻找答案、构建蛋白质二级数据库的基本原则是什么等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9320200.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-27
下一篇 2023-04-27

发表评论

登录后才能评论

评论列表(0条)

保存