用代谢组学「语言」诠释中医药内涵

用代谢组学「语言」诠释中医药内涵,第1张

在国家自然科学基金重大研究计划「中医药学几个关键科学问题的现代研究」及其他相关项目的资助下,黑龙江中医药大学教授王喜军团队利用代谢组学方法发现中医黄疸病证候的关键生物标记物,这为阐释中医黄疸病证候的生物学本质,及诊断客观化、规范化和病证分型治疗提供了依据,有利于提高临床诊断准确率。
揭示 黄疸证候本质
「我们的研究主要是利用现代系统生物学手段,来阐明中医证候的生物学本质,阐明发病机理,鉴定证候的生物标记物,为建立证候诊断标准提供依据,使诊断走出经验模式,实现客观精准、更易推广。」王喜军说,「同时,证候相关生物标记物的阐明,为设计复制证候相关的动物模型,开展相关治疗药物的发现研究提供方法基础。」
王喜军团队应用高通量、高分辨、高灵敏度的分析仪器,结合模式识别等生物信息学技术,建立了中医黄疸病中阴黄证、阳黄证的特征性代谢模式,并从代谢物角度解读阴黄证和阳黄证的科学内涵。
研究人员通过对黄疸病患者的尿样信息进行代谢组学研究,通过一些模式识别分析,获得了相关证型的潜在生物标志物,鉴定阳黄证相关标记物40个,阴黄证标记物49个,首次从代谢组学层面揭示黄疸病的发病机制。
王喜军认为,「证」作为中医有别于现代医学诊疗体系的突出特色,是机体对体内外各种环境变化和致病因素作出反应的一种功能状态,其本质是机体失衡而致的代谢或其网络的改变,机体体液内源性代谢成分的变化通过生物表型的变化而反映出来。代谢组学通过高精确度的分析技术,结合模式识别、专家系统等分析方法从整体上来探讨生命活动在代谢层面的特征和规律,使代谢物含量变化与生物表型的改变建立直接关联,能够更准确地反映生物体系的状态,揭示疾病发生发展的代谢机制,发现和筛选生物标志物,并能为进一步探索治疗靶点提供重要信息。
从粗放迈向精细
「充分借助现代技术,采用代谢组学『语言』对中医药的核心理论及中医独特的传统思维方式和治疗方法进行剖析和诠释,可使中医药能够更好地被现代社会所接受。」王喜军说,「该项研究的思路可推广至其他证候的相关研究。」
王喜军认为,目前一部分人对中医表示反对,主要是与西医相比,传统中医药缺少可测量的指标或数据,中医药中真正的有效成分难以检测,中药具体物质的作用不明确。
「而代谢组学通过对生物体内代谢物的整体组成进行分析,并寻找代谢物与生理病理变化的相对关系的研究方式,为解决传统中医药从粗放迈入药理学的精细化提供了新视角。」王喜军说。
该团队利用现代多维联用技术,研究中药口服后体内成分及其动态变化规律,阐明中药成分的体内命运,同时利用代谢组学对整体代谢轮廓的描述来评价复杂性多元效应。
「结合到方剂及其配伍规律来说,我们认为可以最大限度地从证候的整体效应变化深层面揭示方剂配伍意义。」王喜军说,「整个思路的关键是发现标记物。」
中药饮片或汤剂进入人体后,有效成分会变化或转化,但最终出现在血液中的成分将成为有效物质。因此,基于血液中移行成分的分析就非常关键,在血液中移行成分中查找标记物,并对其量进行分析,为衡量中药材质量和中药的有效性,临床合理用药以及药物发现提供科学的依据。
在国家自然科学基金支持下,王喜军团队开展的「基于代谢组学的证候本质及方证相应研究」目前已建立了利用代谢组学研究证候及方剂效应的技术平台,并提出了「中医方证代谢组学」的概念、理论及研究方法。目前,该团队正在进行心气虚证、肝郁气滞证、气阴两虚证、肾虚证等证候和相关方剂研究。

1 代谢组学富集分析是一种统计分析方法,用于检测代谢组数据中的差异,以及比较不同样本之间的代谢组差异。
2 通路分析是一种生物学分析方法,用于检测和分析生物体内的代谢通路,以及比较不同样本之间的代谢通路差异。

代谢组学分析结合高级遗传群体是研究植物代谢组学的有力工具。然而,水稻( Oryza sativa )代谢组的遗传分析主要是利用自然资源或单个双亲群体进行的。本文以三个具有共同轮回遗传背景的染色体片段代换系群体的剑叶为材料,对水稻的代谢多样性进行了分析。通过将ACC10(A/Z)、Minghui 63(M/Z)和Nipponbare(N/Z)基因组片段引进珍汕97构建的多个相互关联的双亲群体,对代谢数量性状位点(mQTL)进行了有效定位。共产生1587个mqtl,其中684、479和722分别来自A/Z、M/Z和N/Z染色体片段代换系群体。我们鉴定了367个mqtl的99个候选基因。此外,通过25个候选基因的联合连锁分析,特异性地产生了1001个mQTL。其中一些候选基因被验证过,如 LOC_Os07g01020 与吡哆醇及其衍生物的体内含量有关和 LOC_Os04g25980 与顺式玉米苷葡糖基转移酶活性相关。我们提出了O-methylapigenin C-pentoside(O-甲基芹菜素C-戊糖苷)新的生物合成途径,并通过精细定位证明 LOC_OS04G11970 编码了该途径的一个组分。我们推测methylated apigenin(甲基化芹菜素)可能会赋予植物抗病性。这项研究证明了使用多个相互关联的群体能够生成大量可验证的mQTL。在功能代谢组学的背景下讨论了这些结果,并讨论了各自代谢物下候选基因的特征。

大量代谢物由植物产生,其中许多是植物与环境相互作用所必需的。例如,水溶性B6组代谢物不仅在植物抗氧化防御中起作用,而且还可以减少重要的人类疾病的发生率,如高血压和糖尿病。同样,据报道,黄酮类等特殊代谢物参与了植物的生物和非生物胁迫耐受性,并对人类的慢性病和某些癌症具有防御的作用。因此,鉴于代谢产物的重要性,有必要进一步研究其在植物中的功能,探讨其对人类的价值。然而,据估计植物界产生了超过200000种代谢物,并且这些代谢物在不同物种中性质和数量存在很大的差异。因此,有必要更有效、更系统地揭示植物的代谢组。
代谢组学代表了实验系统生物学的一个主要工具,因此,它推动了对复杂遗传特征的理解,无论是单独使用还是与其他组学工具结合。近年来,利用多种代谢组学作为工具探索不同物种的代谢多样性以及通过研究种质资源来解释潜在的生物合成和调控途径方面取得了进展。尽管由于不明确的群体结构和有限的群体资源的限制,关联作图更为流行,已在多种物种(包括拟南芥、番茄、小麦和玉米)的单双亲分离群体中中进行了大量自然变异的mQTL分析。尽管有助于开发和高效地进行QTL定位),但在双亲群体中只有两个基因组的组合可能导致QTL定位的等位基因多样性不足。因此,这可能将mQTL的发现限制在双亲所表现出的多样性上。为解决这一问题,提出了玉米嵌套关联作图群体和多种作物的多个高级遗传互交群体作为多亲本群体解决方案。同时,已经证明利用多个双亲种群也可以提高作图的效率。
水稻是世界上最重要的作物之一,为全球人类消费者提供淀粉和许多其他营养物质。mQTL作图或全基因组关联研究结合代谢组学分析(mGWAS)已在水稻中进行,以解析代谢物含量调节的遗传基础。mGWAS分析提出了将水稻的两个主要亚种(籼稻和粳稻)的生物化学多样性归属于野生后代具有高度遗传多样性。鉴于代谢物与作物产量或营养之间的关系,预计mGWAS和mQTL研究将为理解水稻品种的生物化学多样性奠定遗传基础,并促进功能代谢组学方法应用于培育抗逆性增强和营养特性增强的优良品种方面。为了阐明这些重要代谢性状的遗传基础,我们在3个独立的CSSL群体中对281个代谢物进行了代谢谱分析。这些代谢物是由4个亲本产生的,包括2个典型的籼稻品种(明恢63[MH63]和镇山97[ZS97]),一个粳稻品种(Nipponbare[Nip])和一个野生稻(Oryza rufipogon ACC10),使用ZS97作为共同的轮回背景,其他三个基因型作为独立的供体。结果证明,利用三个相关的CSSL群体可以获得更高的mQTL识别率和更有利于通路的解释。此外,联合连锁分析被证明在绘制某些代谢物图谱方面更为有效。这些联合观察表明,来自不同亲本的群体可能加速代谢产物的基因鉴定和途径阐明。我们随后鉴定和验证吡哆醇(维生素B6的维生素之一)和顺式玉米素O-葡糖苷侧的候选基因。此外,推测了甲基化芹菜素(C-pentoside)产生的生物合成途径。因此,综合结果表明,在鉴定和验证代谢物以及鉴定参与其各自生物合成途径的基因方面,使用这种遗传设计策略能起到很好的促进作用。考虑到候选的代谢物潜在抗病活性,通过代谢分析将为进一步研究特定代谢物提供关键线索。这些研究最终可能试图通过增强植物代谢以确保未来水稻产量中发挥至关重要作用。

抽穗期旗叶采集自4个亲本系,即ACC10(野参)、MH63(籼稻品种)、Nip(日本品种)和ZS97(籼稻品种),以及利用这些亲本系(a/Z、M/Z和N/Z群体)建立的3个CSSL群体的个体,进行代谢谱分析。利用先前建立的广泛靶向代谢组学方法,在水稻旗叶中检测到281种代谢物(其中82种已被标准物质证实),包括29种氨基酸及其衍生物(AAs)、124种黄酮(Flas)、10种脂质(Lips),23个核苷酸,20个酚酰胺(PAs),30种植物激素及其衍生物(PHs)、36种多酚类(PPs)和9种维生素(Vits)。代谢多样性的主成分分析表明,四个亲本在其代谢组分上表现出重大差异。第一主成分和第二主成分(PC1和PC2)分别解释了总方差的417%和331%,且这些成分主要由不同的代谢物类别贡献:三个亲本(ACC10、MH63、Nip,与ZS97相比,Nip和ACC10中Flas和AAs的差异最大,而MH63中PPs的差异最大接下来,我们对三个独立的CSSL群体中281种代谢物的变异系数(CV)进行了评估,结果显示,与A/Z和N/Z群体相比,M/Z系中相对较高的变异(CV为30%-90%)占比较低,表明这些代谢物在M/Z系间的变异较小。此外,与其余两个群体相比,M/Z系具有相对较高的代谢物遗传力。这三个CSSL群体的CV和遗传力的观察结果与MH63和ZS97之间的亲缘关系和M/Z群体的代谢多样性低于其他两个CSSL群体的结果是一致的。

在对不同品系进行代谢物分析之后,我们接下来根据CSSL群体的高密度图进行mQTL分析。共有684、479和722个mQTL分别对应于A/Z、M/Z和N/Z三个群体中的239、216和232个代谢物。去除彼此之间在1 Mb范围内的冗余mQTL,它们构成了1587个非重复位点。我们观察到多个热点的聚集,其中一些热点在不同的种群中是同域的。例如,43、42和54 mQTL被映射到染色体6上的8-12mb区块中,分别占A/Z、M/Z和N/Z群体中6号染色体上映射的mQTL总数的606%、457%和614%。其他热点主要定位在1号、7号和10号染色体上。

考虑到四个亲本系之间的变异是由不同种类的代谢分子引起的,可能不奇怪的是,各个CSSL群体的映射结果也有很大不同。在A/Z群体中,大多数代谢类(除了在N/Z系中最高的Flas;图2A)的mQTL映射更多,当考虑到每个代谢物映射的mQTL平均数时,AAs、PAs、PHs的映射结果可能更好。此外,更多的Flas候选基因是从N/Z系中特性获得的,而更多的AAs、PAs和Vits候选基因是从A/Z谱中获得的。AAs在A/Z群体和Flas在N/Z群体中的优先映射与相应群体中相应代谢物水平的增加变化一致。M/Z总体表现出较少的总mQTL,以及每个代谢物类较少的mQTL,并且在每个代谢物类中映射的映射间隔更宽。

除了分别利用三个定位群体(M/Z、A/Z和N/Z)外,还对整合群体MAN-Z(表明ZS97的染色体片段被MH63、ACC10和Nip的染色体片段所取代)进行了联合连锁分析,以提高定位结果。在此方法下,当与从单个CSSL群体获得的结果相比较时,每个代谢物类别获得更多mQTL,分辨率提高。这种趋势也反应在鉴定的每种代谢物QTLs的数量上,特别是Lips和PHs。例如,12mQTL被映射为来自三个CSSL种群的Lips的最高优势对数(LOD)值9,而54 mQTL被映射为联合种群分析后的最高LOD值195。类似地,分别从三个CSSL种群和联合种群mapping了70和140个PHs mQTL。仅通过该方法获得且在三个CSSL群体中的任何一个群体中都不存在的特定定位位点,进一步说明了整合群体能够增强定位性能。

总之,在这项研究中,证明了使用相互关联的双亲群体不仅能够提供更高分辨率的mQTL,而且能够改进上位性相互作用的分析,从而重建O-甲基芹菜素C-戊糖苷的生物合成途径,并认为该代谢物具有抗病活性。
由于初级代谢物的变化可通过同位素追踪,这对次级代谢物代谢来说并不容易,因此本文和Kliebenstein等人的研究中所述的方法可能对于目前植物次生代谢的通路非常有用,从而提高我们对植物代谢的基本认识。最终,更全面的代谢通路将有助于在作物改良。

Chen, J , et al "Metabolome Analysis of Multi-Connected Biparental Chromosome Segment Substitution Line Populations" Plant physiology 1782(2018):612

代谢通量分析(metabolic flux analysis,MFA)是用计量矩阵模型表示拟稳态假设下胞内反应的一种定量分析方法。它假定一定时间内,胞内中间代谢产物的浓度不变,根据代谢途径中各反应的计量关系以及实验中测得的底物消耗速率或者产物生成速率,基于质量平衡以及可能的能量平衡来确定未知的反应速率,进而确定代谢网络的通量分配图。代谢通量分析不仅精确的定量描述代谢特性,还可以提供一些菌体生理方面更深入的一些信息。通过比较代谢通量的变化,我们就可以对遗传和环境扰动的影响给予充分的评价,并能对特定途径和反应的重要性进行准确的描述。
对于确定系统和超定系统的应用,主要是由实验测得的胞外速率计算出胞内代谢通量分布,从而从更深的层次了解细胞所处的生理状态,常称为代谢通量分析。
代谢通量分析方法
1、谷胱甘肽代谢网络结构模型
依据六个条件(见文献)建立谷胱甘肽代谢网络结构及谷胱甘肽的生物合成途径(文献中图一),并列出胞内代谢反应方程(附表一)。 2、代谢通量的计算
先假设细胞内的中间代谢产物均处于拟稳态,这样由n个中间代谢产物即可得到n个关于速率的约束条件,若选定的总数目为J,则待解问题的自由度为F=J-n这样通过实验测出F个不相关速率可确定整体通量分布。
以xi表示代谢网络中第i种代谢物的积累速率,则有xi =kkjjrara,式中rj 表示生成第i种代谢物的第j个反应的通量,rk为消耗第i种代谢物的第k个反应的通量,aj和ak均为化学计量系数,xi 、rj和rk为比速率。
采用矩阵的形式(见文献)直观地表示出代谢物的积累速率,通过矩阵利用线性代数的知识测定葡萄糖消耗速率、细胞合成速率、谷胱甘肽生成速率等。

@(Dayueban)[靶向|非靶向|代谢组学数据分析]

那么在学习数据分析之前,我还是想和大家一起回顾一下什么叫 代谢组学(Metabolomics) 和 代谢组(Metabolome) 。

在中心法则的指导下,基因组、转录组、蛋白组通常以 信息流 的方式呈现,而代谢组被认为是新陈代谢的结果。但是,很多研究表明代谢物可以参与到生命有机体的生理学功能和稳态,比如:

1 校正批次

1 数据标准化

2 数据分析

21 多元统计分析

那么PCA分析可以由很多方法实现,包括桌面版的软件 SIMCA-P ,在线分析软件 Metaboanalyst ,以及R语言软件包(stats包里的prcomp()和princomp()函数,FactoMineR包的PCA()函数,ade4包的dudipca()函数,以及ExPosition包的epPCA()函数)

22 单变量统计分析

23 构建回归方程进行预测

24 网络分析

[1] Advances in computational metabolomics and databases deepen the understanding of metabolisms

测序行业的蓬勃发展,带来微生物组学日新月异的变化。目前,单一组学的文章不断“贬值”,前沿研究的目光从单一组学逐步拓展至多组学对贯穿分析,即结合多个组学的分析角度,从多个层面阐述生物学机制。

微生物多组学贯穿分析策略十分丰富:如常见的16s与宏基因组贯穿分析,可以验证物种的特征、丰富功能的探究;而16s与代谢组的贯穿分析思路同样常见于高分文章中,通过16s探究不同处理/环境下菌群的物种组成变化,结合代谢组对应的代谢物的变化,进而找到不同处理/环境下引发细菌丰度差异最终导致代谢表型差异的机制。参考阅读《选好思路和方法,给自己一篇多组学高分文章 》

在16s与代谢组贯穿分析中,相关性热图是一个重要的分析手段,主要用于逐一呈现细菌物种与代谢物间的相关性高低,是筛选潜在关联的物种与代谢物的主要途径,对于下游的实验起到指导意义。此类相关性热图在高分文章中频繁出现,足见其重要性(图1、图2)。

图1 物种代谢物热图(2015,Cell Host& Microbe,IF=15753 )[1]

图2 物种代谢物热图(2018,NatureMedicine,IF=30641)[2]

那么,该如何画出此类高分文章中的相关性热图呢?这里,以16s与代谢组的数据为例,向大家分享如何使用R语言进行两个组学数据的相关性计算、绘制相关性热图。

1加载R包

library(psych)

library(pheatmap)

library(reshape2)

2读入数据

phy <-readtable(file = "phyxls", sep = "t", header = T,rownames= 1)

图3 微生物丰度信息表格

met <-readtable(file = "metxls", sep = "t", header = T,rownames= 1)

图4 代谢物丰度信息表格

3计算相关性、p值

cor <-corrtest(phy, met, method = "pearson",adjust= "none")

cmt <-cor$r

pmt <- cor$p

head(cmt)

head(pmt)

4数据保存

cmtout<-cbind(rownames(cmt),cmt)

writetable(cmtout,file= "cortxt",sep= "t",rownames=F)

图5 相关性系数表格

pmtout<-cbind(rownames(pmt),pmt)

writetable(pmtout,file= "pvaluetxt",sep= "t",rownames=F)

图6 p值表格

df <-melt(cmt,valuename= "cor")

df$pvalue <- asvector(pmt)

head(df)

writetable(df,file= "cor-ptxt",sep= "t")

图7 关系对信息

5绘制显著性标记

if(!isnull(pmt)){

ssmt <- pmt< 001

pmt[ssmt] <- ''

smt <- pmt > 001& pmt < 005

pmt[smt] <- ''

pmt[!ssmt&!smt]<- ''

} else{

pmt <- F

}

6绘制相关性热图

mycol<-colorRampPalette(c("blue","white","tomato"))(800)

pheatmap(cmt,scale = "none",cluster_row = T, cluster_col = T, border=NA,

display_numbers = pmt,fontsize_number = 12, number_color = "white",

cellwidth = 20, cellheight =20,color=mycol)

图8 R语言绘制的物种+代谢物相关性热图

pheatmap(cmt,scale = "none",cluster_row = T, cluster_col = T, border=NA,

display_numbers = pmt, fontsize_number = 12, number_color = "white",

cellwidth = 20, cellheight = 20,color=mycol,filename= "heatmappdf")

参考文献

[1]Kostic AD, Gevers D, Siljander H, et al The dynamics ofthe human infant gut microbiome in development and in progression toward type 1diabetes Cell Host Microbe 2015;17(2):260–273doi:101016/jchom201501001

[2]Hoyles, Lesleyet al “Molecular phenomics and metagenomics of hepatic steatosis innon-diabetic obese women” Nature medicine vol 24,7 (2018):1070-1080 doi:101038/s41591-018-0061-3
原文 >

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/12850083.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-28
下一篇 2023-05-28

发表评论

登录后才能评论

评论列表(0条)

保存