当只有自己发生状况时,归结给运气和自己太菜;当别人发生同样的状况时,归结给共同的客观原因,比如网速太慢、电脑太烂;当伟大的互联网告诉你有更多的人遭遇了同样的困惑,才终于投向科学,怪罪无知,无知当然是自己的无知。
在做 jimmy 大神布置的作业:对比 Gorilla, clusterProfiler, topGO 三种工具
作业做到 GSEA 法
得到的结果是下面这样的,出现了65个条目和10个条目两种,似乎还有0条,但手慢无截图
当时的想法是这样的:
毕竟日常网络不好,总天真的以为5G来了一切就解决了┑( ̄Д  ̄)┍
没有错,前后呼应,这是自称资质平平送老迎新的技能树资深半席讲师遇到的状况。依然是同样的参数,不同的结果。
讨论:也许这有一定的随机性?
后来果然发现 gseKEGG() 的一个逻辑参数 seed 是可以设置的,默认值为 FALSE , 那么就惊喜地设置为 TRUE , 又惊喜地发现了依然不同的结果。(sad
回到最初的问题,为什么每次会不一样呢?第二个问题, seed 这个参数到底有没有用?
自己思索无果就求助于互联网(然而其实应该别瞎想直接google
大部分第一个问题基本没有已解决的下文,第二个问题倒是终于发现了这位 心明眼亮 的选手:
当然也有人说并没有用....
不如自己动手尝试:
第一次: no term enriched under specific pvalueCutoff...
第二次:结果又出现辽
看来seed确实是没用的。
另一位心明眼亮的网友如是说:
再回头去看, gseGO() 和 gseKEGG() 默认的方法是 "fgsea".
而 fgsea 算法的文章里有几段话(反正公式是看不懂的也就看点人话猜一下这亚子
大概就是说传统的GSEA方法很慢,可以通过对随机的基因集抽样解决这个问题,也就顾名思义是 a fast gene set enrichment analysis (FGSEA) 了。
与此同时四通八达的 jimmy 大神去问了神包 clusterProfiler 的作者,神通广大的Y叔——
Y叔回答:“ nPerm次数多点就行 seed没用 ”
毕竟
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)