关于GSEA富集结果条目数一跑一变的迷思和恍然大悟

关于GSEA富集结果条目数一跑一变的迷思和恍然大悟,第1张

当只有自己发生状况时,归结给运气和自己太菜;当别人发生同样的状况时,归结给共同的客观原因,比如网速太慢、电脑太烂;当伟大的互联网告诉你有更多的人遭遇了同样的困惑,才终于投向科学,怪罪无知,无知当然是自己的无知。

在做 jimmy 大神布置的作业:对比 Gorilla, clusterProfiler, topGO 三种工具

作业做到 GSEA 法

得到的结果是下面这样的,出现了65个条目和10个条目两种,似乎还有0条,但手慢无截图

当时的想法是这样的:

毕竟日常网络不好,总天真的以为5G来了一切就解决了┑( ̄Д  ̄)┍

没有错,前后呼应,这是自称资质平平送老迎新的技能树资深半席讲师遇到的状况。依然是同样的参数,不同的结果。

讨论:也许这有一定的随机性?

后来果然发现 gseKEGG() 的一个逻辑参数 seed 是可以设置的,默认值为 FALSE , 那么就惊喜地设置为 TRUE , 又惊喜地发现了依然不同的结果。(sad

回到最初的问题,为什么每次会不一样呢?第二个问题, seed 这个参数到底有没有用?

自己思索无果就求助于互联网(然而其实应该别瞎想直接google

大部分第一个问题基本没有已解决的下文,第二个问题倒是终于发现了这位 心明眼亮 的选手:

当然也有人说并没有用....

不如自己动手尝试:

第一次: no term enriched under specific pvalueCutoff...

第二次:结果又出现辽

看来seed确实是没用的。

另一位心明眼亮的网友如是说:

再回头去看, gseGO() 和 gseKEGG() 默认的方法是 "fgsea".

而 fgsea 算法的文章里有几段话(反正公式是看不懂的也就看点人话猜一下这亚子

大概就是说传统的GSEA方法很慢,可以通过对随机的基因集抽样解决这个问题,也就顾名思义是 a fast gene set enrichment analysis (FGSEA) 了。

与此同时四通八达的 jimmy 大神去问了神包 clusterProfiler 的作者,神通广大的Y叔——

Y叔回答:“ nPerm次数多点就行 seed没用

毕竟

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/11309566.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-15
下一篇 2023-05-15

发表评论

登录后才能评论

评论列表(0条)

保存