最简单,但是未必最有效的办法,但是最快
抽个样本,把你的目标基因打上标记,然后建立一个模型,比如决策树等等
模型质量不错的情况下跑全库,然后找出分类结果为你目标分类的记录
kegg 中的通路怎么运用到基因
这个只是皮毛介绍一下KEGG,具体 *** 作还要自己摸索的,用文字不好描述,我还是会一点的,就是先将基因的序列下载下来,上传到KEGG,KEGG会将基因的信号通路网址信息发到你邮箱里,你就可以看到你的目的基因在那些信号通路里有,我有篇这方面的文章发在蚕业科学上,不过刚接受
最简单,但是未必最有效的办法,但是最快 抽个样本,把你的目标基因打上标记,然后建立一个模型,比如决策树等等 模型质量不错的情况下跑全库,然后找出分类结果为你目标分类的记录
如何利用KEGG定位基因属于哪个代谢通路
代谢通路:目前在通路数据库(PATHWAY database) 中代谢通路是建立得最好的,有大约90个参考代谢途径的图形。每个参考代谢途径是一个由酶或EC号组成的网粻丁纲股蕺噶告拴梗茎络。
利用如下方法可通过计算机构建出生物体特有 的代谢通路:
先根据基因的序列相似性和位置相关性确定基因组中酶的基因。
然后合理地安排EC号。
最后将基因组中的基因和参照通路中用EC号编号的基因产物 结合起来。
按大小可以分为1公共数据库
2 从公共数据库中取数据做进一步处理的专业数据库,提供更多的分析工具
按功能分可以有
基因库GENEBANK,蛋白库UNIPROT, 结构库PDB, 功能分类 GO库,通路库 KEGG。
不用专注于4这个数字。随着科研的进步还会有更多的数据库出来。
基因组注释分析主要包括哪些内容
基因组注释包括以下方面的内容:
(1) 重复序列的预测。通过比对已知的重复序列数据库,找出序列中包含的重复序列,识别类型并转化为N或者X,统计各种类型重复序列的分布。
(2) 编码基因的预测。通过将转录组或EST数据比对到拼接后的基因组序列上,找出编码基因位置,预测编码基因结构。或者通过专业的外显子预测,预测编码基因的外显子结构。
(3) 小RNA基因的预测。通过比对已知的小RNA的数据库,或者通过生物信息(bioinformation)学预测,找出这些小RNA基因,并进行分类。
(4) 调控序列和假基因的预测。
基因功能的注释,使用的数据库包括NT/NR, SwissProt/TrEMbl, InterPro, KEGG, COG, Gene ontology等,使用比对的方法,如blast,找出同源相近的基因,并注释功能。
以上就是关于运用KEGG数据库查询某个基因注释到哪些通路全部的内容,包括:运用KEGG数据库查询某个基因注释到哪些通路、怎么一次下载kegg数据库中的全部通路数据、怎么做基于KEGG的生物通路富集分析等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)