初识WGCNA-基础知识_物联网

WGCNA其译为 加权基因共表达网络分析 。该分析方法旨在寻找协同表达的基因模块(module)，并探索基因网络与关注的表型之间的关联关系，以及网络中的核心基因。

适用于复杂的数据模式， 推荐5组(或者15个样品)以上的数据 。一般可应用的研究方向有：不同器官或组织类型发育调控、同一组织不同发育调控、非生物胁迫不同时间点应答、病原菌侵染后不同时间点应答。

从方法上来讲，WGCNA分为 表达量聚类分析和表型关联 两部分，主要包括基因之间相关系数计算、基因模块的确定、共表达网络、模块与性状关联四个步骤。

第一步计算任意两个基因之间的相关系数（Person Coefficient）。为了衡量两个基因是否具有相似表达模式，一般需要设置阈值来筛选，高于阈值的则认为是相似的。但是这样如果将阈值设为08，那么很难说明08和079两个是有显著差别的。因此， WGCNA分析时采用相关系数加权值，即对基因相关系数取N次幂 ，使得网络中的基因之间的连接服从 无尺度网络分布(scale-freenetworks) ，这种算法更具生物学意义。

第二步通过基因之间的相关系数构建分层聚类树， 聚类树的不同分支代表不同的基因模块 ，不同颜色代表不同的模块。基于基因的加权相关系数，将基因按照表达模式进行分类，将模式相似的基因归为一个模块。这样就可以 将几万个基因通过基因表达模式被分成了几十个模块 ，是一个提取归纳信息的过程。

基因之间不仅仅是相关与否，还记录着它们的相关性数值，数值就是基因之间的 联系的权重(相关性)。

模块(module)：表达模式相似的基因分为一类，这样的一类基因成为模块；

Eigengene（eigen +‎ gene）：基因和样本构成的矩阵， >

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/dianzi/10701484.html

初识WGCNA-基础知识

发表评论

评论列表（0条）