NCBI
NCBI下有很多数据库,以下是蛋白质序列PopSet
包括研究1个人群、1个种系产生或描写人群变化的1组组联合序列。PopSet既包括核酸序列数据又包括蛋白质序列数据。
Entrez
功能强大,在于它的大多数记录可相互链接,既可在同1数据库内链接,也可在数据库之间进行链接。当应用BLAST软件比较某氨基酸或DNA序列与库中其他氨基酸或DNA序列差异即进行类似性检索时,则会触及到蛋白质库或核苷酸库的库内链接。库间链接产生在核苷酸数据库内的记录与PubMed库中已发表序列的引文间的链接,或蛋白质序列记录与核苷酸序列库中编码它的核苷酸序列间的链接。BLAST(Basic
Local
Alignment
Search
Tool)是用于序列类似性检索的1个重要数据库,是辨别基因和基因特点的工具。该软件能在15秒内完成全部DNA数据库的序列检索。BLAST记录的相干度有明确的统计学解释,以便更容易地将相干记录与随机的数据库记录像辨别。在NCBI主页的左工具条中,点击BLAST图标,即进入BLAST主页。
BLAST
主页提供了几种BLAST检索软件。其中BLAST20是1种新的BLAST检索工具,它在原有基础上作了改进,运行速度更快,灵敏度更高,同时具有Gapped
BLAST
和PSI-BLAST两种软件的新功能。Gapped
BLAST
允许在对准的序列中引入空位(碱基缺失或插入),引入空位(Gaps)意味着在比较两个相干序列时不会出现中断(Break)现象。这些空位对准的记分系统更能反应相干序列的类似程度。PSI-BLAST的全称是Position-Specific
Iterated
BALST,即特殊位置重复BLAST,它提供了自动、易用的概貌(Profile)检索,是查找序列同源的有效工具。Dnastar
可以用于解决你踢完的后半个问题
目录 1 拼音 2 英文参考 3 概述 4 历史 5 蛋白质的生物化学性质 6 蛋白质的分类 7 蛋白质的功能 71 催化作用 72 信号传导和配基运输 73 营养作用 8 人体蛋白质的生理功能 81 构成和修补人体组织 82 构成酶和激素 83 构成抗体 84 调节渗透压 85 供给热能 9 人体蛋白质的生理价值 10 蛋白质组学与生物信息学 11 蛋白质的结构预测与模拟 12 外部链结 13 参考资料 1 拼音
dàn bái zhì
2 英文参考protein [WS/T 476—2015 营养名词术语]
3 概述蛋白质(protein)是以氨基酸为基本单位,通过肽键连接起来的一类含氮大分子有机化合物[1]。蛋白质是人体必需的营养素[2]。
蛋白质是一种复杂的有机化合物,有些情况下可以用“朊”字来指代蛋白质[3]。蛋白质是由氨基酸分子呈线性排列所形成,相邻氨基酸残基的羧基和氨基通过形成肽键连接在一起。蛋白质的氨基酸序列是由对应基因所编码。除了遗传密码所编码的20种“标准”氨基酸,在蛋白质中,某些氨基酸残基还可以被翻译后修饰而发生化学结构的变化,从而对蛋白质进行激活或调控。多个蛋白质可以一起,往往是通过结合在一起形成稳定的蛋白质复合物,发挥某一特定功能。
蛋白质是动物、植物和微生物等生物细胞的主要成分,是一类高分子含氮的有机化合物的总称。蛋白质是活细胞的组成成分,也是作为维持细胞生活的活性物质(如酶等),与生命现象密切相关的物质,它在体内不断地进行代谢循环,而在外观上似乎保持着恒定状态。蛋白质是由各种Lα氨基酸类(H2N-CHR-COOH,RH即甘氨酸)彼此返复以肽键(……CO-NH……)结合而形成的多肽链(H2N-CHR1-CO-NH-CHR2-CO-NHR3-CO……)。由于蛋白质种类的不同,其所含氨基酸的种类、数量及其结合顺序都不相同,其分子的大小是多种多样的。从鲱鱼和鲑的 蛋白的鱼精蛋白分子量为4千左右直到病毒类那种具有复杂的四级结构的分子量至数亿。对水解后仅生成氨基酸的天然蛋白质称为单纯蛋白质。对水解后除产生氨基酸外,还有其他有机物质的称为结合蛋白质。前者根据溶解度与其来源而分别称为清蛋白、球蛋白、醇溶谷蛋白、谷蛋白、硬蛋白、组蛋白、鱼精蛋白。后者依其所含有的非氨基酸有机物而分别称为核蛋白质、糖蛋白、核糖蛋白、磷脂蛋白、色素蛋白等。此外虽然不是天然蛋白质,但多少进行变化而产生的一族衍生蛋白质则有:白明胶、胨、等。除硬蛋白质外,蛋白质溶于水或稀盐溶液而形成胶体溶液,蛋白质溶液可通过加入醇、丙酮等有机溶剂、硫酸铵等中性盐和三氯醋酸、硫柳酸、生物堿试剂、重金属盐等而使蛋白质沉淀,因此可用来对蛋白质的检出、去除和提纯。为了检出蛋白质和蛋白质中含有的氨基酸,可用双缩脲反应、米伦(Millon′s)反应、**蛋白反应、阿达姆凯威斯(adam-kiewiez)反应、李伯曼(Libermann)反应、毛利斯(Molis-ch)反应等各种显色反应。为了正确分析组成蛋白质的氨基酸的种类和数量,通常可以将样品加入过量的6N盐酸于闭式管中,在110℃下处理约2472小时,然后将水解产物放入以离子交换柱为主体的氨基酸自动分析仪中进行测定。蛋白质中氨基酸的组成和分子内氨基酸的排列顺序,对每种生物和器官都各显有其特征。也就是说蛋白质具有种属和器官的特异性。天然蛋白质是不稳定的物质,因各种物理的(加热、搅拌、薄膜化、紫外线及X线照射等)或化学的(尿素、有机溶剂酸、醇及数种盐类处理等)原因而引起变性。通常,一般的天然蛋白质一旦注入与其不同的动物组织内,便会成为所谓的抗原,在注射过的动物血清中会形成免疫球蛋白,它能和注射蛋白之间引起特异性的抗原抗体反应。因此可利用这种性质用微量(样品)就能判断出两种蛋白质的同一性。
与其他生物大分子(如多糖和核酸)一样,蛋白质是生物体中的必要组成成分,参与了细胞生命活动的每一个进程。酶是最常见的一类蛋白质,它们催化生物化学反应,尤其对于生物体的代谢至关重要。除了酶之外,还有许多结构性或机械性蛋白质,如肌肉中的肌动蛋白和肌球蛋白,以及细胞骨架中的微管蛋白(参与形成细胞内的支撑网络以维持细胞外形)。另外一些蛋白质则参与细胞信号传导、免疫反应、细胞黏附和细胞周期调控等。同时,蛋白质也是人们日常饮食中必需的营养物质,这是因为动物自身无法合成所有必需氨基酸;通过消化所摄入的蛋白质食物(将蛋白质降解为氨基酸),人体就可以将吸收的氨基酸用于自身的蛋白质合成。
蛋白质这一概念最早是由瑞典化学家永斯·贝采利乌斯于1838年提出,但当时人们对于蛋白质在机体中的核心作用并不了解。1926年,詹姆斯·B·萨姆纳揭示尿素酶是蛋白质,首次证明了酶是蛋白质。
第一个被测序的蛋白质是胰岛素,由弗雷德里克·桑格完成,他也因此获得1958年度的诺贝尔化学奖。首先被解析的蛋白质结构包括血红蛋白和肌红蛋白的结构,所用方法为X射线晶体学;
该工作由马克斯·佩鲁茨和约翰·肯德鲁于1958年分别完成,他们也因此获得1962年度的诺贝尔化学奖。
4 历史在18世纪,安东尼奥·弗朗索瓦(Antoine Fourcroy)和其他一些研究者发现蛋白质是一类独特的生物分子,他们发现用酸处理一些分子能够使其凝结或絮凝。当时他们注意到的例子有来自蛋清、血液、血清白蛋白、纤维素和小麦面筋里的蛋白质。荷兰化学家Gerhardus Johannes Mulder对一般的蛋白质进行元素分析发现几乎所有的蛋白质都有相同的实验公式。用“蛋白质”这一名词来描述这类分子是由Mulder的合作者永斯·贝采利乌斯于1838年提出。Mulder随后鉴定出蛋白质的降解产物,并发现其中含有为氨基酸的亮氨酸,并且得到它(非常接近正确值)的分子量为131Da。
对于早期的生物化学家来说,研究蛋白质的困难在于难以纯化大量的蛋白质以用于研究。因此,早期的研究工作集中于能够容易地纯化的蛋白质,如血液、蛋清、各种毒素中的蛋白质以及消化性和代谢酶(获取自屠宰场)。1950年代后期,Armour Hot Dog Co公司纯化了一公斤纯的牛胰腺中的核糖核酸酶A,并免费提供给全世界科学家使用。目前,科学家可以从生物公司购买越来越多的各类纯蛋白质。
著名化学家莱纳斯·鲍林成功地预测了基于氢键的规则蛋白质二级结构,而这一构想最早是由威廉·阿斯特伯里于1933年提出。随后,Walter Kauzman在总结自己对变性的研究成果和之前Kaj LinderstromLang的研究工作的基础上,提出了蛋白质折迭是由疏水相互作用所介导的。1949年,弗雷德里克·桑格首次正确地测定了胰岛素的氨基酸序列,并验证了蛋白质是由氨基酸所形成的线性(不具有分叉或其他形式)多聚体。原子分辨率的蛋白质结构首先在1960年代通过X射线晶体学获得解析;到了1980年代,NMR也被应用于蛋白质结构的解析;近年来,冷冻电子显微学被广泛用于对于超大分子复合体的结构进行解析。截至到2008年2月,蛋白质数据库中已存有接近50,000个原子分辨率的蛋白质及其相关复合物的三维结构的坐标。[4]
5 蛋白质的生物化学性质
细胞色素c的NMR溶液结构,显示了蛋白质的动态结构。
蛋白质并不完全是刚性分子。许多蛋白质在执行生物学功能时可以在多个相关结构中相互转换。在进行功能型结构重排时,这些相关的三级或四级结构通常被定义为不同“构象”,而这些结构之间的转换就被称为“构象变换”。例如,酶的构象变换常常是由底物结合到活性位点所导致。在溶液中,所有的蛋白质都会发生结构上的动态变化,主要表现为热振动和与其他分子之间碰撞所导致的运动。
不同大小的蛋白质的分子表面。从左到右依次为:抗体(IgG)、血红蛋白、胰岛素、腺苷酸激酶和谷胺酰氨合成酶。
蛋白质可以由三级结构的不同大致分为三个主要类别:球蛋白、纤维蛋白和膜蛋白。几乎所有的球蛋白都是水溶性的,许多酶都是球蛋白;纤维蛋白多为结构蛋白;膜蛋白常常作为受体或分子通道,是细胞与外界联系的重要介质。
要了解特定蛋白质的功能,获得其三级结构或四级结构可以提供重要的结构信息。目前用于蛋白质的原子分辨率结构测定的方法主要是X射线晶体学和NMR光谱学。冷冻电子显微学也可以提供超大蛋白质复合物(如病毒、核糖体等)的低分辨率结构信息。[5]而电子晶体学在一些情况下也可以提供较高分辨率的结构信息,特别是对于膜蛋白的二维晶体。[6]解析的结构(包括原子坐标和结构解析的相关信息)通常存放到蛋白质数据库(PDB),供全世界研究者免费。结构预测也可以为未知结构(实验结构)的蛋白质提供结构信息。
6 蛋白质的分类[7]
蛋白质是生命的存在形式,是维持生命的物质基础。人体的一切细胞组织都是由蛋白质组成的,蛋白质占人体重的15%。
根据所含的氨基酸种类齐全与否,营养学把蛋白质分为三大类:完全蛋白质、半完全蛋白质、不完全蛋白质。
(1)完全蛋白质
完全蛋白质含有种类齐全的必需氨基酸,数量充足,比例也较适当,可以满足人体的需要。属于完全蛋白质的有酪蛋白、乳白蛋白、卵白蛋白、卵黄磷蛋白、白蛋白、肌蛋白、大豆蛋白、麦谷蛋白、谷蛋白等。完全蛋白质营养价值高,是高质量的蛋白质。
(2)半完全蛋白质
半完全蛋白质含有各种必需的氨基酸,在种类上是齐全的,但是含量多寡不齐,比例不当,不能完全满足人体的需要。如小麦、大麦中的麦胶蛋白。
(3)不完全蛋白质
不完全蛋白质所含必需氨基酸种类不全,不能满足人体的需要,如玉米胶蛋白、动物结缔组织、胶质蛋白、豆球蛋白等。
蛋白质又可分为单纯蛋白质和结合蛋白质。单纯蛋白质由氨基酸及其衍生物组成,如血清白蛋白、胰岛素等,成分相对比较简单;结合蛋白质是由单纯蛋白质和某些非蛋白质化合物基团所组成。
根据蛋白质在人体内的作用,又可以分为6类:结构蛋白、收缩蛋白、抗体蛋白、血液蛋白、激素蛋白、酶蛋白。
蛋白质可以由三级结构的不同大致分为三个主要类别:球蛋白、纤维蛋白和膜蛋白。几乎所有的球蛋白都是水溶性的,许多酶都是球蛋白;纤维蛋白多为结构蛋白;膜蛋白常常作为受体或分子通道,是细胞与外界联系的重要介质。
7 蛋白质的功能蛋白质是细胞中的主要功能分子。[8]除了特定类别的RNA,大多数的其他生物分子都需要蛋白质来调控。蛋白质也是细胞中含量最为丰富的分子之一;例如,蛋白质占大肠杆菌细胞干重的一半,而其他大分子如DNA和RNA则只分别占3%和20%。[16]在一个特定细胞或细胞类型中表达的所有蛋白被称为对应细胞的蛋白质组。
蛋白质能够在细胞中发挥多种多样的功能,涵盖了细胞生命活动的各个方面:发挥催化作用的酶;参与生物体内的新陈代谢的调剂作用,如胰岛素;一些蛋白质具有运输代谢物质的作用,如离子泵和血红蛋白;发挥储存作用,如植物种子中的大量蛋白质,就是用来萌发时的储备;许多结构蛋白被用于细胞骨架等的形成,如肌球蛋白;还有免疫、细胞分化、细胞凋亡等过程中都有大量蛋白质参与。
蛋白质功能发挥的关键在于能够特异性地并且以不同的亲和力与其他各类分子,包括蛋白质分子结合。蛋白质结合其他分子的区域被称为结合位点,而结合位点常常是从蛋白质分子表面下陷的一个“口袋”;而结合能力与蛋白质的三级结构密切相关,因为结构决定了结合位点的形状和化学性质(即结合位点周围的氨基酸残基的侧链的化学性质)。蛋白质结合的紧密性和特异性可以非常高;例如,核糖核酸酶抑制蛋白可以与人的血管促生蛋白angiogenin以亚飞摩尔(subfemtomolar,即<1015M)量级的解离常数进行结合,[17]但却完全不结合(解离常数>1 M)angiogenin在两栖动物中的同源蛋白抗肿瘤核糖核酸酶(onconase)。非常微小的化学结构变化,如在结合位点的某一残基侧链上添加一个甲基基团,有时就可以几乎完全破坏结合;例如,氨酰tRNA合成酶可以分辨侧链结构非常类似的缬氨酸和异亮氨酸,而这两种氨基酸的差别就在于异亮氨酸的侧链多出一个甲基。相同的蛋白质分子结合在一起就可形成同源寡聚体或多聚体,有些多聚体可以形成纤维;而这些形成纤维的蛋白质往往是结构蛋白,它们在单体状态下是球蛋白,通过自结合来形成刚性的纤维。蛋白蛋白相互作用可以调控酶的活性和细胞周期中的各种进程,并可以使大型的蛋白质复合物得以形成,这样可以将参与同一生物学功能的分子结合到一起,从而提高其工作效率;而结合所诱导的蛋白构象变化对于复杂的信号传导网络的构建也是必不可少的。还有一些蛋白质(如膜蛋白)可以结合或者插入到细胞膜中。
71 催化作用细胞中,酶是最被广泛了解和研究最多的蛋白质,它的特点是催化细胞中的各类化学反应。酶的催化反应具有高度的专一性和极高的催化效率。酶在大多数与代谢和异化作用以及DNA的复制、修复和RNA合成等相关的反应中发挥作用。在翻译后修饰作用中,一些酶(如激酶和磷酸酶)可以在其底物蛋白质上增加或去除特定化学基团(如磷酸基团)。目前已知的酶催化的反应有约4000种。[18]酶可以极大地加速其所催化的反应;例如,与没有酶催化的情况相比,乳清酸核苷5'单磷酸脱羧酶(orotate decarboxylase)的加速作用最高可达1017倍(形象地说,在没有酶的情况下完成反应需要七千八百万年,而存在酶的情况下反应只需18毫秒)。[19]
结合于酶上,并在酶的作用下发生反应的分子被称为底物。虽然酶分子通常含有数百个氨基酸残基,但参与与底物结合的残基只占其中的一小部分,而直接参与底物催化反应的残基则更少(平均为34个残基)。[20]这部分参与底物结合和催化的区域被称为活性位点。有一些酶需要结合一些小分子(辅酶或辅因子)才能够有效发挥催化作用。酶的活性还可以被酶抑制剂所抑制,或被酶激活剂所提高。
72 信号传导和配基运输
带有绿色荧光蛋白标签的蛋白质在不同的细胞区室和细胞结构中的分布图。荧光以白色来显示。左边从上到下依次为,细胞核、内质网、质膜和线粒体;中间从上到下依次为,核小体、高尔基体、细胞质和微管;右边从上到下依次为,核膜、溶酶体、中心体和微丝。
in vivo的蛋白质研究常常专注于蛋白质在细胞中的合成和定位。虽然已经知道许多细胞内蛋白质是在细胞质中合成,而膜结合蛋白质或分泌性蛋白质是在内质网中合成,但蛋白质定位到特定细胞器或细胞结构的特异性是如何达到的,目前还不清楚。一些有助于获得特定蛋白质在细胞中定位的方法得到了发展,特别是用基因工程将目的蛋白质上连接上“报告者”(如绿色荧光蛋白),将这样的融合蛋白在细胞中表达后,就可以通过显微镜观察荧光来了解融合蛋白在细胞中的分布。
另一种常用的同样是基因工程的方法为定点突变。利用这一方法,研究者可以改变蛋白质序列,从而改变其结构、细胞内定位以及调控机制;而这些改变可以在in vivo的情况下通过连接绿色荧光蛋白,或者在in vitro的情况下通过酶动力学的方法以及结合实验进行观察。
73 营养作用构成蛋白质的基本单位是氨基酸,许多氨基酸按不同的方式连结,就成为品种繁多的蛋白质[2]。
大多数微生物和植物能够合成所有20种标准氨基酸;动物则由于缺乏某些氨基酸合成途径中特定氨基酸合成反应所需的关键酶,如从天冬氨酸生成赖氨酸、甲硫氨酸和苏氨酸的合成反应第一步中发挥催化作用的天冬氨酸激酶,而只能合成部分氨基酸。因此,动物必须从食物中获取这些自身无法合成的氨基酸。一个生物体所无法合成而需从食物中获取的氨基酸被称为必需氨基酸。如果环境中存在所需氨基酸,微生物能够直接摄取这些氨基酸,而下调其自身的合成水平,从而节省了原来需要用于合成反应的能量。
动物所摄取的氨基酸来源于食物中所含的蛋白质。摄入的蛋白质通过消化作用而被降解,这一过程通常包括蛋白质在消化系统的酸性环境下发生变性,变性后的蛋白质被蛋白酶水解成氨基酸或小段的肽。随后这些降解片断就可以被吸收。部分吸收后的氨基酸被用于蛋白质的合成,其余的则通过糖异生作用被转化为葡萄糖或进入三羧酸循环进行代谢。蛋白质的营养作用在饥饿环境下显得特别重要,此时机体可以利用自身的蛋白质,特别是肌肉中的蛋白质,来产生能量以维持生命活动。蛋白质/氨基酸也是食物中重要的氮源
人体所需蛋白质在许多食物中都含量丰富,如动物肌肉、乳制品、蛋、豆类、榖类和蕈类等。人体中蛋白质缺乏可以导致全身浮肿、皮肤干燥病变、头发稀疏脱色、肌肉重量减轻、免疫力下降等。
食物中的蛋白质有时会引起过敏反应。
食物蛋白质中含有21种氨基酸,分为必须氨基酸和非必需氨基酸两大类。必需氨基酸人体内不能自行合成,或合成数量难以满足需要,必需由食物蛋白质供给,对成人来说,必需氨基酸有8种,对儿童来说,必需氨基酸有10种,这就是异亮氨酸、亮氨酸、赖氨散、蛋氨酸、苯丙氨酸、色氨酸、苏氨酸,缬氨酸(儿童还包括组氨酸和精氨酸)。非必需氨基酸人体内可自行合成,可满足身体需要,包括甘氨酸、脯氨酸、丙氨酸、羟脯氨酸、谷氨酸、门冬氨酸、组氨酸、精氨酸、酪氨酸、羟谷氨酸、胱氨酸、丝氨酸、半脱氨酸。[2]
8 人体蛋白质的生理功能蛋白质是生命的存在形式,是维持生命的物质基础。人体的一切细胞组织都是由蛋白质组成的,蛋白质占人体重的15%。蛋白质的主要生理功能是[2]:
81 构成和修补人体组织蛋白质是构成和修补人体组织的“建筑材料”,人体内的神经、肌肉、内脏、血液、骨骼甚至指甲、毛发,都含有蛋白质,身体的生长发育、衰老组织的更新、损伤组织的修补都需要蛋白质的供应。
82 构成酶和激素人体内发生的化学变化有成千上万种,形成了人体的新陈代谢,而这些化学变化大多需要酶的催化。酶广泛参加入体的各种生命活动,如肌肉收缩、血液循环、呼吸、消化、神经传导、感觉、思维、生育等,如果没有酶的参加,生命活动就无法正常进行,而酶的主要成分正是蛋白质。
激素是人体内分泌腺分泌的物质,直接进入血液分布到全身,对肌体的代谢、生长、发育、繁殖起重要的调节作用,如甲状腺素、肾上腺素、胰岛素等。激素也是由蛋白质构成。
83 构成抗体抗体是一种蛋白质,其功能是“抵抗”细菌和病毒等外来蛋白质的入侵,保护人体不受侵害,如用于治癌的干扰素。
84 调节渗透压正常人血液与组织液之间存在着水分的交换,靠血浆和组织液中的电解质和胶体蛋白来保持平衡。当组织液与血浆中的电解质浓度相等时,两者间的水分分布就取决于血浆中血蛋白的浓度。长期缺乏蛋白质的人,其血浆蛋白含量便会降低,血液内的水分就渗入周围组织,造成营养不良性水肿。
85 供给热能在体脂耗尽的情况下,人体会以蛋白质为“燃料”作为热能。
9 人体蛋白质的生理价值蛋白质的生理价值是评定食物蛋白营养价值的常用方法,其数值是蛋白质在体内保留量与吸收量的百分比,即[2]:
粪便中排出的蛋白质,为摄入而不被吸收的部分:尿中排出的蛋白质,为吸收而未被利用部分。一般以测量粪、尿中含氮量来换算。[2]
蛋白质的生理价值越高,说明在体内的利用率越高,但实际上没有达到100的。常见食物中,鸡蛋的生理价值最高,达到94,牛奶为85,猪肉74,牛肉76,羊肉69,鱼肉83,大豆64,大米77,小麦67,玉米60,花生59。[2]
蛋白质生理价值的高低,取决于其所含氨基酸的组成。食物中所含氮基酸的成分和比例越接近于人体需要,其生理价值就越高,反之,就越低。为了提高蛋白质的生理价值,可以把两种或两种以上蛋白质混合食用,使其中所含氨基酸互为补充,尽量接近人体需要的种类和比例。如大豆和玉米混合食用、动植物蛋白混合食用,这样可以取长补短,提高生理价值。一般来说,搭配的种类越多越好。[2]
人体体表面积计算器 BMI指数计算及评价 女性安全期计算器 预产期计算器 孕期体重增长正常值 孕期用药安全性分级(FDA) 五行八字 成人血压评价 体温水平评价 糖尿病饮食建议 临床生化常用单位换算 基础代谢率计算 补钠计算器 补铁计算器 处方常用拉丁文缩写速查 药代动力学常用符号速查 有效血浆渗透压计算器 乙醇摄入量计算器医学百科,马上计算!
10 蛋白质组学与生物信息学在一定时间内一个细胞或一类细胞中存在的所有蛋白质被称为蛋白质组,研究如此大规模的数据的领域就被称为蛋白质组学,与基因组学的命名方式相似。蛋白质组学中关键的实验技术包括用于检测细胞中大量种类蛋白质相对水平的蛋白质微阵列技术,和用于系统性研究蛋白蛋白相互作用的双杂交筛选技术。此外,还有探究所有组分之间的可能的生物学相互作用的相互作用组学,以及系统性地解析蛋白质结构,并揭示其中的可能的折迭类型的结构基因组学。
目前各类数据库中含有许多种类的生物体的大量的基因组和蛋白质组数据,包括人类基因组的数据;要对这些数据进行分析已获得有用的信息,就需要用到近来来发展起来的新兴学科──生物信息学。生物信息学的发展使得现在研究者可以通过序列比对有效地鉴定相关生物体的同源蛋白质。利用序列信息推导工具(sequence profiling tool)可以对更特异地对序列进行分析,如限制酶图谱、针对核酸序列的开放阅读框架分析以及二级结构预测。利用特定软件,如ClustalW,可以从序列信息中可以构造出系统树并进行进化分析。生物信息学的研究领域包括集合、注释和分析基因组和蛋白质组数据,这就需要应用计算技术于生物学问题,如基因识别和支序分类。
11 蛋白质的结构预测与模拟作为结构基因组研究的互补,蛋白质结构预测的目标是发展出有效的能够提供未知结构(未通过实验方法得到)蛋白质的可信的结构模型。目前最为成功的结构预测方法是同源建模;这一方法是利用序列相似的蛋白质(已知结构)的结构作为“模板”。而结构基因组的目标正是通过解析大量蛋白质的结构来为同源建模提供足够的模板以获得剩余的未解析的同源蛋白结构。从序列相似性较差的模板计算出精确的结构模型对于同源建模法还是一个挑战,问题在于序列比对准确性的影响,如果能够获得“完美”的比对结果,则能够获得精确的结构模型。[28]许多结构预测方法已经被用于在蛋白质工程领域,在这些方法的帮助下,研究者们设计出一些新型的蛋白质折迭类型。更为复杂的结构计算是预测蛋白质分子之间的相互作用,需要应用分子对接法和蛋白蛋白相互作用预测。
利用分子动力学的方法可以模拟蛋白质的折迭和结合过程。通过分布式计算,如Folding@Home计划,为分子动力学模拟注入了活力。小的α螺旋蛋白结构域,如villin的头部和HIV辅助蛋白已经成功地在计算机中(in silico)被模拟。将分子动力学和量子力学相结合的方法已经被用于探索视网膜色素分子的电子态
12 外部链结(英文)蛋白质数据库(The Protein Databank)
(英文)UniProt蛋白质资源
(英文)Human Protein Atlas
(英文)iHOP Information Hyperlinked over Proteins
(英文)NCBI Entrez的蛋白质数据库
(英文)NCBI的蛋白质结构数据库
(英文)人类蛋白质参考数据库
(英文)人类蛋白质百科
(英文)斯坦福大学的Folding@Home
(英文)Proteins: Biogenesis to Degradation The Virtual Library of Biochemistry and Cell Biology
按大小可以分为1公共数据库
2 从公共数据库中取数据做进一步处理的专业数据库,提供更多的分析工具
按功能分可以有
基因库GENEBANK,蛋白库UNIPROT, 结构库PDB, 功能分类 GO库,通路库 KEGG。
不用专注于4这个数字。随着科研的进步还会有更多的数据库出来。
以下哪些数据库是核酸数据库?
AGenBank
BEMBL-ENA
CDDBJ
DSwissprot
ETrEMBL
FUniprot
GPDB
H、SCOP
I、CATH
J、NCBI-Gene
正确答案:GenBank;EMBL-ENA;DDBJ;NCBI-Gene
目前,数据库管理系统关系型数据库为主导产品的商品化,技术相对成熟。虽然面向对象的数据库管理系统的先进技术,数据库易于开发,维护,但尚未成熟的产品。国际和国内领先的关系数据库管理系统,甲骨文,Sybase,Informix和INGRES。这些产品支持多种平台,如UNIX,VMS,Windows上,而不是同一级别的支持。和成熟的IBM的DB2关系数据库。但是,DB2是内嵌于IBM的AS/400系列机,只支持OS/400 *** 作系统。
?1MySQL
?MySQL是最受欢迎的开源SQL数据库管理系统,由MySQL AB公司,发布和支持。 MySQL AB是基于MySQL开发一个商业公司,它是利用与开源值相结合的一个成功的商业模式?和方法论的第二代开源公司。 MySQL是MySQL AB的注册商标。
?MySQL是一个快速,多线程,多用户和健壮的SQL数据库服务器。 MySQL服务器支持关键任务,重负载生产系统的使用,它可以嵌入到一个大配置(大规模部署)软件。
?的MySQL与其他数据库管理系统相比,具有以下优点:
?(1)MySQL是一个关系数据库管理系统。
?(2)MySQL是开源。
?(3)MySQL服务器是一个快速,可靠和易于使用的数据库服务器。
?(4)在MySQL服务器的客户机/服务器或嵌入式系统。
?(5)可以使用MySQL软件。
2SQL Server的吗?
?SQL Server是由微软开发的数据库管理系统,是目前最流行的数据库,用于存储在网络上的数据,它已被广泛用于电子商务,银行,保险,电力和其他数据库相关的产业。
?SQL Server 2005的最新版本,它只能在Windows作业系统的稳定运行是非常重要的数据库。并行实施和共存模型并不成熟,这是很难对付越来越多的用户和数据量是有限的,可扩展性。
?SQL Server提供了网络和电子商务功能,如丰富的XML和Internet标准的支持,轻松且安全地通过Web访问的数据的范围很广,有一个强大,灵活和网络,基于安全和应用管理。此外,由于它的易用性和友好的用户界面,通过广大用户的好评,。
?3Oracle
?提出的数据库,该公司首先想到的,通常是甲骨文(Oracle)。该公司成立于1977年,原是一个专门开发的数据库公司。甲骨文一直在数据库领域的领导者。 1984年,第一个关系数据库转移到一台台式电脑。然后,Oracle5率先推出的分布式数据库,客户机/服务器体系结构的新概念。甲骨文公司的第一行锁定模式和对称多处理计算机的支持最新的Oracle对象技术,成为关系 - 对象数据库系统。目前,甲骨文的产品涵盖了几十个型号的大,中,小型机,Oracle数据库已成为世界上使用最广泛的关系数据。
Oracle数据库产品具有以下优良特性。
?(一)兼容性
?Oracle产品使用标准的SQL,和美国国家标准技术局(NIST)测试后。兼容IBM的SQL / DS,DB2中,安格尔的IDMS / R。
?(2)可移植性
??甲骨文的产品,可以广泛的硬件和 *** 作系统平台上运行。可以安装在超过70种大不同,VMS系统的DOS,UNIX上,Windows和其他 *** 作系统,小型机;
?(3)协会
甲骨文与各种通信网络连接,支持各种协议(TCP / IP协议说,DECnet,LU62工作等)。?
?(4)高生产率
?Oracle提供了多种开发工具,可以极大地方便进一步的发展。
?(5)开放
?Oracle的兼容性,可移植性,连接性和高生产力的Oracle RDBMS具有良好的开放性。
?4Sybase
?马克B Hiffman和罗伯特·爱泼斯坦,1984年,创建了Sybase公司,并于1987年推出了Sybase数据库产品。 SYBASE主要有三种版本:一是UNIX *** 作系统版本下运行的Novell Netware环境下运行的版本; Windows NT环境下运行的版本。 UNIX *** 作系统,目前应用最广泛使用的SCO UNIX SYBASE 10 SYABSE- 11。
??的Sybase数据库的特点:
?(1)它是基于客户机/服务器体系结构的数据库。
?(2)它是真正开放的数据库。
?(3)它是一种高性能的数据库。
?5DB2
?DB2是内嵌在IBM的AS/400系统的数据库管理系统,直接从硬件支持。它支持标准的SQL语言,异构数据库连接的网关。因此,它具有速度快,可靠性好等优点。但是,只有硬件平台选择了IBM的AS/400,可以选择使用DB2数据库管理系统。
?DB2可以运行在所有主要平台(包括Windows),最适于海量数据。
?DB2是使用最广泛的企业级,而国内约5%,在1997年,在世界最大的500家企业,近85%的DB2数据库服务器。
?此外,微软的Access数据库,FoxPro数据库。现在有这么多的数据库系统,在游戏中进行编程,应该选择什么样的数据库?首要的原则,根据实际需要,另一方面,考虑游戏开发预算。现在常用的数据库:SQL Server中,我的SQL,甲骨文,FoxPro的。 MySQL是一个免费的数据库系统,其功能与一个标准的数据库功能,因此,建议使用独立制片人。甲骨文虽然功能强大,但它是用于商业用途,是目前在比赛中很少使用。
>
我原来常用的:
NCBI:持有INSDC的节点。网站上有核酸、蛋白、基因名、基因组名等等的搜索工具,以及BLAST序列比对搜索工具,PUBMED文献数据库,Taxonomy数据,COG蛋白家族库等等。FTP可以下到它全部的数据库,BLAST的单机程序,以及各种工具程序。
EBI:和NCBI类似,欧洲搞的对等物。感觉EBI网站比NCBI要清楚简洁。另外EBI网站整合了更多的工具,比如多序列比对。
Uniprot:全蛋白库。NCBI和EBI的蛋白库来源于此。目前包括两部分:SwissProt是人工校对过的,TrEMBL是自动校对的。
Pfam:蛋白家族库。可以使用配套的HMMER进行搜索。比BLAST能找到更远缘的东西,而且找到的东西是结构域。
Rfam:RNA的,类似Pfam。
以上就是关于如何在uniprot数据库中查找某个蛋白序列全部的内容,包括:如何在uniprot数据库中查找某个蛋白序列、蛋白质简介、生物信息数据库分为哪四大类等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)