kegg是一个整合了基因组、化学和系统功能信息的数据库。全称Kyoto Encyclopedia of Genes and Genomes(京都基因和基因组百科全书)。
与其他数据库相比,kegg的一个显著特点就是具有强大的图形功能,它利用图形而不是繁缛的文字来介绍众多的代谢途径以及各途径之间的关系,这样可以使研究者能够对其所要研究的代谢途径有一个直观全面的了解。
kegg是一个综合数据库,它们大致分为系统信息、基因组信息和化学信息和健康信息,进一步可细分为18个主要的数据库。可以通过不同的颜色编码来区分。
我们可以根据自己所要查询的信息,在不同子数据库里具体查询,也可以在总页面的上方输入关键字查询,输入的关键词越多,查询到的结果越快捷精确。
kegg建立了kegg直系同源系统(theKEGG Orthology (KO)system),这个系统通过把分子网络的相关信息连接到基因组中,从而发展和促进了跨物种注释流程。
结果表明,kegg被当做一个参考知识库,被广泛的用于基因组测序和其他高通量实验技术得到的大规模数据集的整合和解释中。
除了保持对基础研究的支持,随着kegg分子网络的一些小变化,kegg正在朝着更加偏向于实际应用的方向发展,这些应用主要集中在整合人类疾病、药物和其他与健康相关的物质。
如何利用KEGG定位基因属于哪个代谢通路代谢通路:目前在通路数据库(PATHWAY database) 中代谢通路是建立得最好的,有大约90个参考代谢途径的图形。每个参考代谢途径是一个由酶或EC号组成的网络。
利用如下方法可通过计算机构建出生物体特有 的代谢通路:
先根据基因的序列相似性和位置相关性确定基因组中酶的基因。
然后合理地安排EC号。
最后将基因组中的基因和参照通路中用EC号编号的基因产物 结合起来。
1.打开KEGG数据库首页,链接如下:http://www.genome.jp/kegg/,如下所示:点击“KEGG PATHWAY”字样链接,可见如下界面:
一直往下看,会发现KEGG数据针对pathway做了分类,主要包含Metabolism、Genetic Information Processing、Environmental Information Processing、Cellular Process、Organismal Systems、Human Diseases、Drug Development七个方向,并针对每个方向还有更为细致的分类,例如Metabolism包含Carbohydratemetabolism、Energy metabolism、Lipid metabolism等,各位看官可以根据您的研究方向或感兴趣通路选择具体的pathway进行查看。
2.假如我们关注Carbohydrate metabolism下的Pentose phosphate pathway,点击后获得如下界面:
其中最上面的Reference pathway表示我们目前查看的通路是所有物种通用的pathway,下面的一段文字是对这个pathway的介绍,再下面网络图显示此pathway具体信息。
其中带有Pentosephosphate pathway字样的方框点击开可发现对这个通路的其他信息介绍,同时可看到这个通路的ID(map00030),这个用map开头+数字组成的ID表示所有物种通用的通路ID,如果是某一特定物种的ID,会以该物种的3个字母简写名字+数字组成,例如hsa00030。在网络图中方框表示的是参与反应的酶,例如1.1.1.47,这是酶的ECnumber,国际酶学委员会赋予的编号。
小圆圈表示化学反应中的化合物,例如beta-D-Glucose(C00221)。箭头代表的是反应方向,虚线表示此反应可以通过中间产物或其中途径发生联系。大椭圆表示与此通路相关的另一个pathway。如果您想要只关注human的Pentose phosphate pathway,就可以在Reference pathway处进行选择,之后点击Go即可。
这个时候您会发现在第一行显示与不选择物种时有一定区别,会标记为human信息,同时点击网络图中的带有Pentose phosphate pathway的方框,里面会有human的这个通路的信息,包含了human该通路的pathway ID(hsa00030)和介绍。
网络图本身也有变化,部分方框为浅绿色,其他不变。其中浅绿色方框为人类含有的酶,例如3.1.1.17,把鼠标放在上面会有相关信息显示。白色方框的酶在人类中不含有,把鼠标放在上面不会有任何信息显示。
浅绿色方框可以点击开查看详细信息,例如点击3.1.1.17,获得如下界面,Entry为该酶在KEGG数据库中的ID,Gene name为此酶的简化名,Difinition为此酶的通用名字EC number,KO是在KEGG数据库中该酶的同源序列号,Pathway中罗列出了该酶参与的通路,除此之外,还显示很多其他信息,例如编码该酶的三级结构(Structure)、基因序列(NT seq)和氨基酸序列(AA seq)等信息。
注意哦,上图的右上角,有一个Help字样,如果您对此页面中信息不清楚,可以点击Help,页面里对每项都有相应的详细介绍。
如果您知道自己关注通路的ID,可以直接在第一步的基础上直接搜索,也可以获得特定物种的通路信息,例如上面的human的Pentosephosphate pathway,ID为hsa00030,我们就可以直接用这个ID进行搜索,具体 *** 作为在步骤1的第二幅图中填入ID号,选择物种has,点击Go即可,页面如下:
在出现的页面中,点击hsa00030这个通路即可。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)