细胞组分
分子功能
生化过程主要针对的是基因(Gene)的产物(RNA或Protein),而不只是gene本身;因为某个gene存在可变剪切,同一个gene有多种表达产物;这个gene 产物有个专有ID即GO term。GO term之间的关系(Relationship):
is a
part of
has part
regulates
occurs in GO注释 原理 其实现有的很多数据库之间已经实现互相注释,即表示nr-swissport-go-Ko等等之间的ID是一一对应起来的;所谓的注释即获得该基因表达产物的GO term ID就行了。 方式一 利用blast、diamond等工具将序列比对并获得到nr、swissport等数库中对应的序列ID(gene id或gene symbol等等);根据数据库ID对应字典(idmapping.tb.gz)查询获得GO term ID。 方式二 利用interproscan等工具注释序列的功能域(Domain)或Motif,并获得对应的GO term ID。 利用eggnog
最简单快捷的方式。
可视化利用WEGO
富集分析 原理常用的富集分析方法有Fisher精准概率法。以GO富集分析为例:
在单基因分析筛选差异表达基因基础上,Fisher精准概率法利用几何分布(hypergeometric distribution)原理,推断每个基因集中的差异表达基因的比例是否与整个基因集中差异表达基因的***比例***相同。该方法包括两个假设:
Fisher’s Exact Test原理:https://www.pathwaycommons.org/guide/primers/statistics/fishers_exact_test/
Fisher’s Exact Test和卡方检验的区别:
https://blog.csdn.net/u011955252/article/details/50704459
富集分析:https://www.jianshu.com/p/3cd3fc14ba16?utm_campaign=haruki&utm_content=note&utm_medium=seo_notes&utm_source=recommendation *** 作
利用GeneOntology的AmiGO
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)