生物信息学进 有基因组蛋白序列,如何将每个序列匹配到COG数据库,如一条序列对应J,及翻译,在线等多谢

生物信息学进 有基因组蛋白序列,如何将每个序列匹配到COG数据库,如一条序列对应J,及翻译,在线等多谢,第1张

用COG数据库下的COGNITOR程序进行

下载地址:

http://www.ncbi.nlm.nih.gov/COG/old/xognitor.html

可以进行:

1,蛋白的注解。COG的一个蛋白成员的已知功能(以及二维或三维结构)可以直接应用到COG的其他成员上去。然而,这里也要警告,因为有些COG含有paralogs,它们的功能并非对应与那些已知蛋白。

2,种系发生图谱。这给出在一个特定的COG中一个给定物种是否存在某些蛋白。系统使用,这些图谱可以用来确定在一个物种中是否一个特定的代谢途径。

3,多重对齐。每一个COG页面包括了一个链接到COG成员的一个多重对齐,那可以被用来确定保守序列残基和分析成员蛋白的进化关系。

分子生物学:在分子水平上研究生命现象的科学。研究生物大分子(核酸、蛋白质)的结 构、功能和生物合成等方面来阐明各种生命现象的本质。研究内容包括各种生命过程如光合作用、发育的分子机制、神经活动的机理、癌的发生等。

组蛋白密码:遗传特异性由基因组碱基序列决定,序列变化导致细胞行为改变。但是科学发展到今天,这已不是问题的全部。有人提出"表观遗传学"概念,表观遗传学的一个典型例子就是抑瘤基因异常甲基化与肿瘤相关。随着转录调控研究的深入,一种新的调节机制 --"组蛋白密码"日益被科研工作者重视,组蛋白密码信息存在于转录后组蛋白修饰等过程中。

在真核细胞的细胞核中,核小体是染色质的主要结构元件(见图)。核小体主要由四种组蛋白(H2A,H2B,H3和H4)构成。这四种组蛋白和缠绕于组蛋白的DNA共同组成了核小体。每个组蛋白都有进化上保守的N端拖尾伸出核小体外。这些拖尾是许多信号传导通路的靶位点,从而导致转录后修饰。该类修饰包括组蛋白磷酸化、乙酰化、甲基化、ADP-核糖基化等过程。尤其是组蛋白乙酰化、甲基化修饰能为相关调控蛋白提供其在组蛋白上的附着位点,改变染色质结构和活性。一般来说,组蛋白乙酰化能选择性的使某些染色质区域的结构从紧密变得松散,开放某些基因的转录,增强其表达水平。而组蛋白甲基化既可抑制也可增强基因表达。乙酰化修饰和甲基化修饰往往是相互排斥的。在细胞有丝分裂和凋亡过程中,磷酸化修饰能调控蛋白质复合体向染色质集结。

细胞对外在刺激作出的每一个反应几乎都会涉及到染色质活性的改变,这一改变就是通过修饰组蛋白,变换组蛋白密码实现的。既然几乎每一种生物学过程都有特定的组蛋白修饰标记,那么特定的组蛋白修饰标记就能反应相应的特定生物学过程。因此通过组蛋白修饰系列抗体特异性地识别靶蛋白修饰形式,就能简化对组蛋白修饰的研究

染色质的转录活性与组蛋白修饰相伴(见表1)。总体上来说,组蛋白乙酰化水平增加与转录活性增强有关,而组蛋白甲基化修饰的结果则相对复杂,它可以是转录增强或转录抑制。

表1-组蛋白修饰与转录状态

转录激活 转录抑制

乙酰化 增加 降低

赖氨酸甲基化 组蛋白H3 K4 组蛋白H3 K9,K27,K79

精氨酸甲基化 组蛋白H3 R2,R17,R26 降低

组蛋白H3 R4

有丝分裂过程也与特异性组蛋白修饰有显著的相关性。在有丝分裂过程中,有数个组蛋白磷酸化反应,其中大多数由Aurora B激酶催化。特异性组蛋白修饰可在有丝分裂的不同阶段检测到,在细胞核分裂中发挥多种功能

组蛋白修饰于有丝分裂

分裂间期 G2/M 分裂早期 分裂晚期

H3 S10 Phos +/- + +++ ++++

H3 S28 Phos - - ++ +++

CENP-A Ser 7 Phos - - +++ +

H4 K20 Me + ++ +++ +++

组蛋白修饰还参与DNA损伤和凋亡。在凋亡的级联反应中,激酶(包括CHK1和CHK2)的主要底物之一是组蛋白衍生物H2A.X ,H2A.X的磷酸化是凋亡早期最早标志之一。在凋亡后期,Caspase激活蛋白激酶Mst1, Mst1使组蛋白H2B的14位丝氨酸磷酸化。这一修饰在染色质浓缩步骤中可检测到,是凋亡途径良好的标记物。也有报道称在凋亡过程中发现组蛋白H2B的32位丝氨酸磷酸化。

随着组蛋白密码学说的进一步完善,研究者将能: 1更好地开发新药。研究组蛋白密码对药物开发具有战略意义,多种组蛋白修饰酶已成为相关疾病治疗的靶目标。比如,组蛋白去乙酰酶(HDACs)抑制剂已应用于临床治疗多种肿瘤;2 深入探讨遗传调控和表观遗传调控相互作用的网络与不同生物学表型之间的关系;3 在控制真核基因选择性表达的网络体系内进一步深入理解染色质结构、调控序列以及调控蛋白之间交互作用的内在机制;4 建立基因表达的调控网络数据库及其分析系统。总之,随着越来越多组蛋白核心结构区域和修饰方式的确定,组蛋白密码在基因调控过程中的作用会越来越明确。

反式剪切:--------

内含子定界:内含子是基因内的间隔序列,不出现在成熟的RNA分子中,在转录后通过加工被切除。大多数真核生物的基因都有内含子。

在转录后的加工中,从最初的转录产物除去的内部的核苷酸序列。术语内含子也指编码相应RNA内含子的DNA中的区域。大多数真核结构基因中的间插序列(intervening sequence)或不编码序列。它们可以转录,但在基因转录后,由这些间插序列转录的部分(也可用内含子这个术语表示)经加工被从初级转录本中准确除去,才产生有功能的RNA。基因的编码部分称外显子。内含子常比外显子长,且占基因的更大比例。真核基因所含内含子的数目、位置和长度不尽相同,如鸡卵清蛋白基因的外显子被7个内含子隔开,鸡卵伴清蛋白基因有17个内含子,α-珠蛋白基因有2个内含子,卵粘蛋白基因有6个内含子等。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/9865126.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-02
下一篇 2023-05-02

发表评论

登录后才能评论

评论列表(0条)

保存