基因表达谱的SOM聚类分析识别功能基因集

基因表达谱的SOM聚类分析识别功能基因集,第1张

前不久我接触了这样一个分析,给定基因表达矩阵后,通过 自组织映射(Self-organizing map,SOM) 技术识别其中的高表达基因集,以便和功能建立如敏昌关联。

下拿颤文将该方法简称为SOM聚类分析,因为它就是一种基于神经网络的聚类算法。那么,SOM聚类在表达谱数据中是如何应用的呢?本篇我们就来看一下。

为了帮助大家理解这种方法,首先来看文献“ NLRP3 inflammasome activation drives tau pathology ”中的部分内容。

作者构建小鼠模型,模拟额颞叶痴呆(FTD)病理学效应。Tau22小鼠转基因了人类tauFTD变体,并在一段时间内发展为tau病理学。获取野生型(WT)和Tau22小鼠的脑组织并提取RNA,包括2、8、11月龄的小鼠,进行RNA芯片分析基因表达,获得脑组织在tau病理学过程中显著被激活的基因。

作者通过SOM聚类,鉴定了参与tau蛋白的致病性基因集 。渣扒分别根据野生型或Tau22小鼠在3、8、11月时间点的相似表达水平将基因分组,并根据表达水平升高将其定义为每种条件的特征基因。共识别了6个主要的表达模块,同一模块内的基因集具有相似的表达模式,它们在该时间点均处于相对高表达的状态,暗示它们在这些时间点中发挥主要活性。

为了明确这些高度活跃的基因发挥的功能,随后作者通过基因集富集分析(GSEA),比较Tau22小鼠相较于WT小鼠中哪些途径被激活。在3个月大的Tau22小鼠中,特征基因显示与免疫反应的联系,表明在疾病开始时特征基因就参与了免疫过程;而在疾病发展后期,小鼠中上调的基因参与了诸如“应激反应”等功能中,且高达73%的特征基因与干扰素相关。

不难理解,上述文献中,作者通过SOM聚类识别高度表达的基因集,用作功能分析。

本篇模仿该文献中的思路,展示如何在R中执行基因表达谱的SOM聚类。

使用kohonen包执行SOM聚类,首先安装加载该包。

接下来基于示例的基因表达谱,对各基因执行SOM聚类。

如上过程基于基因表达值进行了聚类,获得了聚类模块,并按模块内基因的平均表达值赋值了模块颜色。随后,即可从图中判断选择高表达的模块,将其中的基因挑选出来,作为发挥生物学过程的“活跃”基因集。

那么,如何获得各模块中,都包含哪些基因呢?参考以下 *** 作。

这样,就将基因名称和其所属模块对应起来了。

最后,识别高表达的模块,并从中进一步筛选基因集就可以了。这些基因集既然存在高表达,那么必然会和功能密不可分。了解它们的功能,可以初步执行GO或KEGG富集分析进行探索,如开篇展示的文献中思路那样,不再多说了。

通过大数据进行输出。

记所有输出神经元c组成的集合为,神经元c与输入层神经元之间的连接权向量为,算法作为一种非监督类的方法,理论上可以将人以为的输入模式在输出层映射成一维、二维甚至更高维的离散图形,并保持其拓扑结构不变。

聚类特征和聚类特征树:BIRCH聚类的重要策略9.1.3BIRCH的聚类过程:由存储空间决定的动态聚类9.1.4聚类的R实现9.1.5聚类应用:两宴陆期清嫌岗位培晌正顷训的比较9.2网络聚类概述。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/yw/12507409.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-26
下一篇 2023-05-26

发表评论

登录后才能评论

评论列表(0条)

保存