水稻微生物研究方向

水稻微生物研究方向,第1张

水稻微生物组动态变化揭示核心垂直传播的种子内生微生物

期刊:Microbiome

IF:16837

发表时间:2022129

第一作者:张晓霞,马毅楠

通讯作者:魏海雷

通讯作者单位:中国农科院农业资源与农业区划研究所

DOI号:101186/s40168-022-01422-9

实验设计

实验设计图:本研究基于两代水稻、6个品种(RBQ、L31、M63、P64、Dular和Kasalath)、4个种植区(三亚、廊坊、南昌和西双版纳)、5个取样部位(散土、根际土、根内、茎内、种子内)的481份样品进行了高通量微生物组深度解析。

结果

1水稻微生物群落多样性及其驱动因素

作者利用Chao1和Shannon指数描述样品的α-多样性后发现,同一水稻品种的根际、根、茎和种子内生微生物在不同地区的α-多样性没有显著差异。此外,6个水稻品种的根际、根内、茎内和种子内样品的α-多样性指数在4个种植地点没有显著差异,说明水稻基因型对微生物多样性没有影响。此外,根际和散土微生物群落的α-多样性在4个种植地点具有明显的差异,然而,内生微生物(茎、根和种子)多样性在4个地点具有不同的分布,表明外界环境对水稻内部的微生物多样性影响不大。重要的是,作者还发现水稻微生物的α-多样性不受品种和种植地区的影响,始终呈现从根际、根、茎到种子内降低的规律。

图1 水稻相关微生物群落的α-多样性。

d和g, 6个水稻品种不同取样部位的4个种植地区合集的Chao1和Shannon指数。e和h, 4个种植地区6个水稻品种不同微生境微生物区系的Chao1和Shannon指数。f和I, 不同取样部位的所有水稻品种和种植地区合集的Chao1和Shannon指数。

通过基于Bray-Curtis相异性的PCoA分析,结果显示取样部位是微生物组变异的最主要影响因素(R2 = 0314, p < 0001),而受种植地区(R2= 00967, p < 0001)和水稻品种(R2 = 00106, p = 0478)的影响较小。可见,取样部位是水稻微生物组组成的主要驱动力。这些数据表明,水稻微生物群落的多样性从根部远处到近处、从外部到内部、从地下到地上呈稳步下降趋势。

图2 基于Bray-Curtis相异性的水稻取样部位、种植地区和品种的PCoA分析。

2水稻微生物的群落组成及动态变化

为了调查水稻微生物的群落组成及动态变化,作者分析了在不同条件下的水稻微生物群落富集和组成情况。对于散土样品,三亚种植区的β-变形菌纲(Betaproteobacteria)的占比最高(579%),而其他细菌菌纲占比均小于10%。相比之下,放线菌纲(Actinobacteria)广泛分布在廊坊和西双版纳种植区,而疣微菌门(Verrucomicrobia subdivision 3)在南昌种植区显著富集。根际土样品细菌群落组成与散土样品十分相似,但少数类群在这两种取样部位间变化明显,例如β-变形菌纲(Betaproteobacteria)。γ-变形菌纲(Gammaproteobacteria)是唯一一个在散土、根际、根、茎和种子中逐渐富集的菌纲,而放线菌纲、α-变形菌纲和β-变形菌纲逐渐减少,说明水稻内部生态位更加有利于γ-变形菌纲的生存。因此,来自于γ-变形菌纲的泛菌属(Pantoea)和黄单胞菌属(Xanthomonas)比来自α-变形菌纲的鞘氨醇单胞菌属(Sphingomonas)和β-变形菌纲的食酸菌属(Acidovorax)在研究水稻内生方面更加具有优势。此外,在不同取样部位中丰度最高的前五个菌纲和菌属呈现动态变化,在子代种子样品中,γ-变形菌纲和泛菌属最为优势。

图3 水稻取样部位微生物群落组成。

a,纲水平散土、根际土、根内、茎内、子代种子和亲代种子内生微生物组成柱状图。b, 纲水平各取样部位前五汇总图。c, 属水平散土、根际土、根内、茎内、子代种子和亲代种子内生微生物组成柱状图。d, 属水平各取样部位前五汇总图。

3细菌共现性网络和关键类群

通过构建不同取样部位的细菌共现性网络,作者进一步解析了细菌类群和取样部位间复杂相互作用对水稻微生物群落组成的影响。总体而言,网络的复杂性从根际、根内、茎内到种子内逐步降低。根据模块化指数可以观察到地下部分(散土、根际土和根内)比地上部分(茎内和种子内)具有更明显的模块化趋势。子代种子内样品的网络节点数、边数和平均聚类系数均为最低,网络组成最为简单。由此可见,取样部位对微生物网络的构建具有显著影响。作者根据网络节点解析微生物群落中的关键微生物。网络节点中变形菌门数量最多,且在茎内和种子内生样品中所有的节点微生物都来自变形菌门,说明该菌门在水稻内生微生物组中的重要地位。

图4 基于SparCC构建的微生物网络及网络参数。

a, 水稻微生物组不同取样部位间的共现性网络。每个节点代表一个细菌ASV,青色标记代表网络节点,边的颜色代表作用类型,红色代表正相关,蓝色代表负相关。b, 各取样部位间微生物网络的主要拓扑结构特征。

4水稻核心内生菌群

为了挖掘能够在水稻中垂直传播的核心内生微生物类群,作者首先以大于70%的阈值在不同地点、水稻品种和微生境中提取核心ASV,最终在根、茎和子代种子内生样品中分别发现了438个、94个和27个ASV,其中三者共有的ASV为14个,分布在两个菌门,6个菌目。因此,作者推测水稻核心内生菌群的组成并不完全随机,而是受到了细菌特征、宿主环境和代谢特点的影响。

图5 水稻核心内生微生物和垂直传播类群。

a, 韦恩图显示高频率出现在水稻内生取样部位(根内、茎内和种子内)的ASV。b, 韦恩图展示10个潜在的从亲本种子垂直传播到子代种子的ASV。c, 在不同取样部位的潜在垂直传播ASV的绝对丰度。

5种子内生菌垂直传播的证据

为了鉴定潜在的垂直传播细菌类群,作者分析了核心内生菌和亲代种子内生样品之间的重叠ASV,发现在14个共有内生ASV中,10个均来自亲代种子内生样品。同时ASV_2 (Pantoea)、ASV_26 (Pseudomonas)、ASV_48(Xanthomonas)和ASV_238(o_Enterobacterales)在根内、茎内、亲代种子和子代种子样品中的绝对丰度和出现频率均显著高于散土和根际土样品,表明这4种ASV最有可能是垂直传播的类群。

为进一步获得垂直传播的细菌类群,作者对种子内生细菌进行了高通量地分离、培养、纯化和鉴定,从4个种植地区和2个水稻品种(P64和Dular)的亲子代种子中分离获得了957株细菌。其中泛菌和黄单胞菌是数量最多的两个细菌菌属,分别占分离菌株的3939%和2769%。21株泛菌和27株黄单胞菌的部分16S rRNA基因序列分别与ASV_2和ASV_48序列完全相同。其中,9株泛菌和17株黄单胞菌来源于子代种子样品,其余均来自亲代种子样品。作者对这些菌株进行了基因组草图测序并进行了系统发育分析,发现分离获得的泛菌菌株分别属于P ananatis、P dispersa和 P stewartia三个种,黄单胞菌均为X sacchari种。通过比对亲代和子代的ANI值和核心基因组的相似性,发现来源于子代种子的8株泛菌与来源于亲代种子的9株泛菌具有极高的相似性;来自子代种子样品的4株黄单胞菌与来自亲代的4株菌株黄单胞菌具有极高相似性。以上结果表明种子内生菌在株系水平上存在垂直传播。

图6 可培养的垂直传播水稻种子内生菌鉴定。

a, 四个水稻种植区、两个水稻品种的亲代种子和子代种子中分离获得的可培养细菌菌株数量。b,圈图展示a中菌株属水平相关关系。c, 亲代种子和子代种子样品中分离的泛菌菌株ANI热图。d, 亲代种子和子代种子样品中分离的泛菌菌株串联核心基因组一致性热图。e, 亲代种子和子代种子样品中分离的黄单胞菌菌株ANI热图。f, 亲代种子和子代种子样品中分离的黄单胞菌菌株串联核心基因组一致性热图。

6可垂直传播的种子内生菌群基因组挖掘和功能特征

为了进一步阐明水稻中可垂直传播类群的潜在功能,作者对所有已测序的内生泛菌和黄单胞菌菌株进行基因组挖掘分析。作者计算了泛菌和黄单胞菌的泛基因和核心基因数量,并利用COG和KEGG数据库对核心基因进行了功能注释。在COG注释中,核心基因组显著富集在E(氨基酸转运和代谢)和G(碳水化合物转运和代谢)两个功能类别中,且KEGG注释中同样存在高度相关的 “碳水化合物代谢”和“氨基酸代谢” 通路。随后,作者重点关注了级代谢产物、蛋白质分泌系统和酶三大功能类别,分析中发现所有泛菌菌株都含有促进植物生长相关的1-氨基环丙烷-1-羧酸(ACC)脱氨酶和吲哚乙酰胺水解酶(iaaH)。此外,所有泛菌基因组中都具有编码多种消化酶的基因,如右旋糖酶、β-半乳糖苷酶、果胶酶、纤维素酶和淀粉酶基因。并且均具有T1SS、T5aSS和T6SS,而只有少数菌株具有T2SS、T3SS、T4SS、T5bSS和T5cSS。黄单胞菌基因组中也具有iaaH基因和丰富的消化酶编码基因如β-半乳糖苷酶、淀粉酶和果胶酶基因。然而,分离出的黄单胞菌菌株基因组中仅含有T1SS、T4SS和T5SS,而不含致病性T3SS和T6SS。随后作者对部分泛菌和黄单胞菌进行了一些促生功能特征的检测并发现所有菌株都具有纤维素酶活性,并能够产生吲哚-3-乙酸(IAA),这与基因组挖掘的结果相对应。

图7 水稻种子垂直传播内生菌的系统发育分析。

a, 基于1258个单拷贝同源基因的串联多序列比对建立的21株泛菌菌株与20株模式菌株的最大似然发系统发育关系。b, 基于892个单拷贝同源基因的串联多序列比对建立的27株泛菌菌株与22株模式菌株的最大似然发系统发育关系。SM,次生代谢产物;PSS,蛋白质分泌系统;ENZ,消化酶。

总结

本研究建立了水稻内生微生物资源库,并通过多尺度微生物组学分析,阐明了种子内生微生物组中核心类群的垂直传播与功能特征,对未来开发种子内生菌并提高植物适应性奠定了理论基础。对进一步理解微生物-植物共进化理论提供了新的证据。水稻内生微生物资源在营养转化与吸收、抗病抗逆、耐胁迫等方面表现出的巨大潜力,也为微生物肥料、微生物农药、微生物种衣剂、微生物防腐剂的研发开辟了新的思路。

中国农科院农业资源与农业区划研究所张晓霞研究员和马毅楠博士后为该论文的共同第一作者,魏海雷研究员为通讯作者。该研究得到国家自然科学基金、中国农业科学院科技创新工程等项目资助。

分化时间是宏观进化的内容,以某一特定类群的化石记录作为参照点,通过 基因序列间的分歧程度 以及 分子钟 来估计速率恒定分支间的分歧时间,同时计算系统发育树上其他节点的发生时间,从而推断相关类群的起源时间和不同类群的发生时间。

分子钟:一个特定的生物大分子(蛋白质或DNA)在所有的演化谱系中具有恒定的演化速率。其中,演化谱系是指不同类群。

Beast2软件基于多序列比对后的结果,按照mcmc(马尔可夫蒙特卡洛方法)构建贝叶斯进化树,而ML(最大似然法)和贝叶斯进化树对氨基酸/核苷酸替代模型的选择非常敏感,故在进行进化树或分化时间构建之前,需对氨基酸/核苷酸替代模型进行选择。

对氨基酸替代模型的选择基于prottest软件进行,对核苷酸替代模型的选择基于jModeltest进行。在基于同源蛋白构建进化树并计算分化时间的过程中,使用beast2软件前,通常先使用prottest软件对氨基酸替代模型计算AIC、BIC分值或DT来寻找最佳模型,分值越小越优;随后根据最佳模型参数,使用beast2软件进行进化分化时间估计,在计算完成后,对进化树进行一系列可视化并美化的 *** 作。

示例1:基于单拷贝直系同源基因构建的NJ进化树示例图

示例2:基于beast2软件构建的贝叶斯进化树和分化时间示例图

流程:

具体参考:

>

首先关于同源的定义就比较多,如果以序列相似性作为唯一依据话,可以采用NCBI上的blast软件进行序列比对。用basic blast 中的nucleotide blast软件,将基因A提交给服务器,在参数设置的database中选EST(expressed sequence tags),进行blast,返回的结果中,排列越前的就是同源性越高的。

这个方法是以序列相似一定就是同源基因为基本假设的,一般而言这样做是可行的。但就同源基因本身这个概念来讲我们可以认为同源基因基本都是序列相似的,但这并不能代表序列相似就一定是同源的。

前言:因为最近陆陆续续接手了几个物种的基因组项目,这也是生信分析中很大的一块。其中最基础的是组装和注释(当然我们实验室也做组装方法学的研究)。现在随着很多物种基因组的发表,纯基因组想发个很好的文章没有新颖的故事感觉也挺难的。看最近关于基因组的文章,尤其是已经release过的物种,好像都是在炒泛基因组/SV的概念。因为我们做的是多倍体物种,所以更多的就牵扯到多倍体进化,物种的比较等等比较基因组学的内容。所以最近一直在陆陆续续的系统学习一些这方面的分析。

先介绍几个概念。

Orthologs(直系同源物)是在两个物种的最后共同祖先(LCA)中来自单个基因的一对基因。直系同源物是同源性基因,是物种形成事件的结果。Paralogs(旁系同源物)是同源基因,是重复事件的结果。下图就可以看到,不同物种间的alpha-chain gene互为Orthologs(直系同源物)。这时候可以引用一个新名词orthogroup (正交群)就用来形容自一组物种的LCA中的单个基因的基因组(在图中就是alpha chain gene)。然后同一物种间alpha 和beta chain gene互为Paralogs(旁系同源物)。最后所有这些关系都可以由OrthoFinder来识别。

在介绍基因家族收缩和扩张之前,有一个概念是绕不过去的,就是基因家族。

 

基因家族(gene family),是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物,同一家族基因可以紧密排列在一起,形成一个基因簇,但多数时候,它们是分散在同一染色体的不同位置,或者存在于不同的染色体上的,各自具有不同的表达调控模式。在基因组项目中,通常会选择自己要研究的物种和其近缘的物种通过比对来寻找基因家族。

谈论到直系同源基因分析的时候,大部分教程都是介绍OrthoMCL,这是2003年发表的一个工具,目前的引用次数已经达到了3000多,但这个软件似乎在2013年之后就不在更新,而且安装时还需要用到MySQL(GitHub上有人尝试从MySQL转到sqlite)。

 

而OrthoFinder则是2015年出现的软件,目前已有400多引用。该软件持续更新,安装更加友好,因此决定使用它来做直系同源基因的相关分析。

那么,OrthoFinder能做什么?

OrthoFinder: solving fundamental biases inwhole genome comparisons dramatically improves orthogroup inference accuracy提到,它的优点就是比其他的直系同源基因组的推断软件准确,并且速度还快。

 

此外它还能分析所提供物种的系统发育树,将基因树中的基因重复事件映射到物种树的分支上,还提供了一些比较基因组学中的统计结果。

 

OrthoFinder的分析过程分为如下几步:

 

1 BLAST all-vs-all搜索。使用BLASTP以evalue=10e-3进行搜索,寻找潜在的同源基因。(除了BLAST, 还可以选择DIAMOND和MMSeq2)

2 基于基因长度和系统发育距离对BLAST bit得分进行标准化。

3 使用RBNHs确定同源组序列性相似度的阈值

4 构建直系同源组图(orthogroup graph),用作MCL的输入

5 使用MCL对基因进行聚类,划分直系同源组

OrthoFinder2在OrthoFinder的基础上增加了物种系统发育树的构建,流程如下:

1 为每个直系同源组构建基因系统发育树

2 使用STAG算法从无根基因树上构建无根物种树

3 使用STRIDE算法构建有根物种树

4 有根物种树进一步辅助构建有根基因树

5 基于Duplication-Loss-Coalescent 模型,有根基因树可以用来推断物种形成和基因复制事件,最后记录在统计信息中。

===安装===

对于我这种安装软件总是无能的人,conda真是拯救了我。

conda install -c bioconda -c conda-forge orthofinder

==测试例子运行===

orthofinder -f ExampleData -S mmseqs

注: -f 指定文件夹

        -S 指定序列搜索程序,有blast,mmseqs, blast_gz, diamond可用

so easy!!!

OrthoFinder的基本使用就是如此简单,而且最终效果也基本符合需求。

 

如果你想根据多序列联配(MSA)结果按照极大似然法构建系统发育树,那么你需要加上-M msa。这样结果会更加准确,但是代价就是运行时间会更久,这是因为OrthoFinder要做10,000 - 20,000个基因树的推断。

 

OrthoFinder默认用mafft进行多序列联配,用fasttree进行进化树推断。多序列联配软件还支持muscle, 进化树推断软件还支持iqtree, raxml-ng, raxml。例如参数可以设置为-M msa -Amafft -T raxml

 

并行化参数: -t参数指定序列搜索时的线程数,-a指的是序列搜索后分析的CPU数。

===结果文件===

运行结束后,会在ExampleData里多出一个文件夹,Results_ Jun07, 其中Jun07是我运行的日期

 

(1) Results Files: Orthogroups

包含一个主文件“Orthogroupscsv”和两个支持文件:

Orthogroupscsv,每一行为一个group,每一列为一个物种,行列交汇处为基因名称。

Orthogroups_UnassignedGenescsv,包含所有未分配到任何group的基因名称。

Orthogroupstxt,OrthoMCL格式的输出结果,内容等同于Orthogroupscsv。

(2)Results Files: Comparative_Genomics_Statistics

包含一些统计数据,可用于比较基因组分析、绘图以及质控。

Statistics_Overallcsv和Statistics_PerSpeciescsv,提供基本的描述信息

Orthogroups_SpeciesOverlapstsv,两两物种的group共享矩阵

- G50:group中的基因数,使得50%的基因处于该大小或更大的group中。

- O50:最小数量的group,使得50%的基因处于该大小或更大的group中。 

- Number of single-copy orthogroups:每个物种中只有一个基因的group(相当于单拷贝核心基因)。这些group是构建物种树和许多其他分析的理想选择。

- Unassigned gene:未与任何其他基因划分到一个group的基因。

(3) Results Files: Orthologues

        两两物种间的直系同源基因,每一行为一个group,第一列为group编号,第二列为第一个物种的基因,第三列为第二个物种的基因。同一物种的基因名以“,”分割。直系同源物可以是一对一,一对多或多对多。

(4) Results Files: Gene_Trees and Species_Tree

        每个group的基因树和定根的物种树以newick格式输出,可以用各种看树软件展示,如MEGA、iTOL、Dendroscope和FigTree等,个人推荐用iTOL。例子的species的tree展示:

===其它用法===

1  添加新物种到之前的分析(previous_orthofinder_directory指的是包含“SpeciesIDstxt”的目录)

orthofinder -bprevious_orthofinder_directory -f new_fasta_directory

 

2 从之前的分析中移除物种

从输出目录下找到工作目录“WorkingDirectory”中的“SpeciesIDstxt”文件,在要移除的物种那一行最前面加上一个“#”并保存,然后运行(previous_orthofinder_directory指的是包含“SpeciesIDstxt”的目录):

orthofinder -bprevious_orthofinder_directory

 

3 同时添加和删除物种

编辑好“SpeciesIDstxt”后,运行:

orthofinder -b previous_orthofinder_directory-f new_fasta_directory

以上就是关于水稻微生物研究方向全部的内容,包括:水稻微生物研究方向、BEAST分析详解、已知一个小鼠基因A,如何利用EST分析得到人类基因组中与A基因同源的基因分步骤回等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/9694151.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-01
下一篇 2023-05-01

发表评论

登录后才能评论

评论列表(0条)

保存