生物中NST和SND是什么_工具

与次生细胞壁生物合成相关的 NAC 转录因子家族成员主要包括三类，SND，NST 和 VND。在 19 种高等植物中开展的 SND，NST 和 VND 基因的比较基因组学分析显示该家族首次在卷柏（Selaginella moellendorffii）基因组中出现，而且只有 VND 基因出现在 S moellendorffii 中，对早于 SND 和 NST。 SND，NST和 VND 基因在拟南芥和水稻各个组织的表达模式进行了系统分析，并在水稻中对部分基因进行了验证，结果显示 SND 和 NST 在植物茎组织中明显高表达。进一步基因共表达调控网络分析发现，这些 NAC 基因和 MYB 基因具有共调控现象，在调节细胞壁合成中起协同调控作用。

分享一篇多肽信号在胚胎与胚乳之间移动，调控胚胎角质层发育的文章。

在胚胎发育早期，胚胎中产生TWISTED SEED1(TWS1)小肽的前体，通过初生不连续角质层的空隙，扩散到胚乳中，由胚乳特异表达的ABNORMAL LEAF SHAPE1(ALE1)酶加工成活性肽，回到胚胎中，与胚胎特异表达的受体激酶GASSHO1/2(GSO1/2)识别，调控形成完整的胚胎角质层。

植物的角质层（The plant cuticle）是由疏水的脂质和蜡质分泌到表皮细胞的细胞壁外侧后形成的。

在拟南芥胚胎发育的早期，胚胎角质层是初生不连续的，到心形胚时期，胚胎表皮细胞外侧形成完整的角质层，将胚胎细胞与周围的胚乳细胞等隔开。

GASSHO1 (GSO1) 和GSO2 受体激酶在胚胎中表达，影响在胚胎发育过程中影响角质层的功能。 gso1 gso2 双突变体表型：对亲水性燃料的透性增强，50-80%的子叶融合。

转录因子ZHOUPI (ZOU) 和ABNORMAL LEAF SHAPE1 (ALE1)是两个胚乳特异的转录因子（endosperm specific proteins）。有研究表明 GSO1、GSO2与ZOU、ALE1在同一条通路上调控胚胎发育。

枯草杆菌蛋白酶（subtilase）在胚乳中表达，能够对肽前体进行加工，TWS1 前体和GASSHO 受体在胚胎中表达。TWS1在2016年被报道与角质层的沉积有关。

被子植物的种子可以划分为三个区间：合子胚、胚乳、种皮。

CASPARIAN STRIP INTEGRITY FACTORs (CIFs)是一种酪氨酸硫酸化多肽个人注：酪氨酸硫酸化多肽需要进行翻译后修饰，该类多肽有：PSK\PSY\RGF，通过酪氨酸硫酸化转移酶 TPST 进行催化， CIF1/2作为GSO1/2的配体 ，调控根内皮层中凯氏带的形成。那CIFs是否调控胚胎角质层的发育呢。作者沿着这条思路，构建遗传材料 cif1 cif2 cif3 cif4 ，并未观察到种子扭曲、高渗表型表型(fig S1A)。

在2016年报道了TWS1调控胚胎角质层，这里作者重新敲除得到了 tws1 的突变体，与 gso1-1 gso2-1 种子扭曲、高渗表型一致，且不存在加性， 说明TWS1与GSO1/2在同一条通路上。

并且在 tws1 中胚胎角质层的发育也同样受损，更进一步暗示TWS1可能与GSO1/2共同调控胚胎角质层的发育。可从上述表型，以及已有的报道中推测，因为GSO1/2的配体是与TWS1同属于硫酸化的肽

至此，本文通过TPST酶的突变表型，推测受该酶加工的某种肽调控该表型，于是首先猜到CIFs，但是四突没表型，于是猜测其他的，结合TWS1多肽的报道，重新敲除后确定TWS1表型。文章做到这里，一般的思路是往下验证TWS1与GSO1/2互作，共同调控表型，结束，比较常规，且同类家族的多肽CIFs与GSO1/2作为配体受体已经被报道过，新意有待提升。

那么作者是如何往下进行思考的呢？

前文提到的 ale1 表型，以及领域内的背景知识：ALE1与GSO1/2在同一条通路上调控胚胎角质层的发育，并且ALE1蛋白酶是在胚乳中特异表达，那如果能够阐明ALE1的加工对于TWS1的活性是必须的，那就与这几个基因的表达部位的特异性，以及细胞分区，精确调控相关，就很有意思了。

接下来证明 TWS1能够被ALE1加工 ，在烟草体内，和体外纯化中证明TWS1被ALE1加工切割，并进一步细化到切割位点位于His 54 和 Gly 55 。将TWS1的这两个氨基酸突变后，TWS1将不能被ALE1切割，说明这两个氨基酸残基对于TWS1的剪切位点非常关键。并且依赖于ALE1的加工发生在TWS1的C端。后面的几句没太懂，个人理解是，TWS1和CIFs的氨基酸序列比较来看，由于CIFs位置更靠C端，TWS1没那么靠近C端，所以TWS1的C端需要ALE1进行加工来激活TWS1的活性。这或许可以解释同类硫酸化多肽在种子和根中发挥不同功能。

通过以上三类实验，证明了：

1、TWS1被ALE1加工

2、TWS1与GSO互作

3、N端硫酸化至关重要

4、C端ALE1切割至关重要

tpst 纯合突变体用野生型花粉进行授粉后，没有胚胎表型，在F1代中只有tpst x tpst展示出表型，说明该表型是合子起源？。

TPST在种子中遍在表达，为了探索哪一个区室的TPST对TWS1产生影响，于是分别用遍在启动子 RPS5A 、胚胎特异启动子 PIN1 、胚乳特异启动子 RGP3 驱动TPST的表达。结果： RPS5A 、 PIN1 下均能回补，只有 RGP3 驱动下，不能回补，这暗示 TPST对TWS1的加工在胚胎中发生 。

并且TWS1的定位分析显示:TWS1在胚胎初期开始在整个胚胎区域表达，随后，被限制在root tip表达pattern同样暗示了：这种前后期表达的差异非常重要。

那么TWS1作为信号肽在胚胎中产生，在胚胎中用TPST进行N端硫酸化加工，为什么还需要跑到胚乳中用ALE1进行C端加工，然后再跑回胚胎中与受体GSO结合，调控胚胎角质层完整性的沉积？这样穿梭的意义，或者需要在特定细胞分区之间加工的意义是什么呢？

作者在 tws1 背景下转入 pTWS1:ALE1 ，得到胚胎特异表达的ALE1，然后通过杂交引入TWS1，这样得到均在胚胎中表达的TWS1、ALE1以及GSO为什么要在 tws1 背景下。该类种子成熟时严重枯萎，但仍有部分可以发芽，说明胚胎中所有信号持续共表达会对种子发育产生负面影响，胚胎信号的持续激活，引起种子的应激基因上调。这就为上一个问题提出了解释：空间的分区或许提供了 胚胎信号衰减 的条件。

以上两部分说明了：TWS1信号若在从产生到加工一直在胚胎中，即胚胎信号在胚胎中持续共表达，会引起种子应激，对种子发育有害。在胚乳中进行的加工，具有对胚胎发育/角质层沉积的调节作用。

综上，作者提出，TWS1在胚胎产生，胚乳加工，再返回胚胎发挥功能，这样的双向信号传导模式能够有效地监察胚胎角质层的完整性。具体为：

参考文献

1 >

用于作图群体的类型可有多种。一般说来，在这类群体中，异花授粉植物分子标记的检出率较自花授粉植物的高。但是对于基因的图位克隆而言，培育特殊的遗传群体是筛选与目标基因紧密连锁的分子标记的关键环节。这些遗传材料应该满足这样的条件，即除了目标基因所在座位的局部区域外，基因组DNA序列的其余部分都是相同的，在这样的材料间找到的多态性标记才可能与目标基因紧密连锁。

目标基因的近等基因系(NILs)是符合条件的一类群体。近等基因系是指几乎仅在目标性状上存在差异的两种基因型个体，这可通过连续回交的途径获得。由于NILs的遗传组成特点，一般凡是能在近等基因系间揭示多态性的分子标记就极有可能位于目标基因的两翼附近。Martin等(1993)就是用RAPD技术分析番茄PTO基因的近等基因系而获得了与该基因表现共分离的分子标记，以该分子标记为探针筛选基因组文库而实现了染色体登陆。又如在玉米上，利用AFLP技术分析玉米CMS-S型雄性不育的恢复基因及近等基因系，已获得与目标基因紧密连锁的分子标记并以其用作分离RF3基因的探针。

一般说来，当标记为显性遗传时，欲获得最大遗传信息量的F2群体，须借助于进一步的子代测验，以分辨F2中的杂合体。为此，Michelmore等(1991)发明了分离群体分组分析法(bulked segregant analysis，BSA)以筛选目标基因所在局部区域的分子标记。其原理是将目标基因的F2(或BC1)代分离体的各个体仅以目标基因所控制的性状按双亲的表型分为两群，每一群中的各个体DNA等量混合，形成两个DNA混合池(如抗病和感病、不育和可育)。由于分组时仅对目标性状进行选择，因此两个DNA混合池之间理论上主要在目标基因所在局部区域的差异，这非常类似于NILs，故也称作近等基因池法。研究表明，近等基因系法、分离群体分组分析法再结合AFLP等强有力的分子标记技术使人们能够在短时间内从数量众多的分子标记中筛选出与目标基因紧密连锁的标记。更为有意义的是，这种策略在尚未构建遗传图谱的物种中也是可行的。比较基因组研究主要是利用相同的DNA分子标记(主要是cDNA标记和基因克隆)在相关植物种之间进行遗传或物理作图，比较这些标记在不同物种基因组中的分布特点，揭示染色体或染色体片段上的基因及其排列顺序的相同(共线性)或相似性(同线性)，并由此对相关物种的基因组结构和起源进化进行分析。已有的研究表明，存在生殖隔离的不同植物物种之间在标记探针的同源性、拷贝数及连锁顺序上都具有很大程度的保守性。如番茄、马铃薯和辣椒；水稻、小麦和玉米；小麦、黑麦和大麦；高粱和玉米；拟南芥和芸薹属；以及大麦和水稻。更为有趣的是，Moore等(1995)同时对水稻、小麦、玉米、谷子、甘蔗及高粱等6种主要禾本科物种的基因组进行了比较作图研究，结果表明其中基因组最小的水稻居于中枢的位置，即这些禾本科植物基因组的保守性可归结到水稻基因组的19个连锁区段上。由这19个区段可实现对所研究的全部禾谷类作物染色体的重建，并可构成一个禾谷类作物祖先种的染色体骨架。通过这一研究，人们对禾谷类作物的进化演变历程有了更深入的认识。植物比较基因组的研究成果表明，在更广的范围上，包括禾本科、十字花科、豆科植物及一些树木的基因组在基因组成和基因排列顺序上都存在很大程度的一致性。而在包括小麦、玉米和水稻等重要农作物的禾本科作物上，基因组成和排列顺序的一致性非常完好，人们可以在模式植物水稻上用图位克隆技术克隆相关物种的大多数重要基因。此外，比较基因组研究还给人们一个重要的启示，那就是模式植物上遗传作图的成果可推而广之，这对那些遗传作图工作相对滞后的植物尤其重要。比较基因组作图使建立高密度遗传连锁图可资利用的标记显著增加，从而大大提高获取离目标基因很近的分子标记的可能性。

比较基因组作图是利用分子标记技术在1个目标性状的分离群体中把目的基因定位于染色体的一定区域内，然后通过利用高密度的分子连锁分析，以精细定位目的基因。目前，作图的类型可分为2类，分别是遗传图谱和物理图谱。遗传图谱对图位克隆虽然非常重要，但更精细的物理图谱尤为重要。而增加图谱上的分子标记数目是精细作图的基础，增加分子标记的方法—是整合已有的遗传图谱，再者就是寻找新的分子标记。现在已有越来越多的植物的遗传图谱趋于饱和，如水稻已有3275个分子标记的图谱，覆盖基因组的15125 cM和10400个EST标记。目前利用稀有切点内切酶结合PEGE技术已成功用于植物基因组的大规模物理作图，从而可以确定连锁标记与目的基因间的实际物理距离的大小，为基因的克隆奠定了基础。一旦把目标基因定位在某染色体的特定区域后，接下来就要对其进行精细的作图及筛选与目标基因紧密连锁的分子标记。目前的作图类型分为两类，分别是遗传图谱和物理图谱。

（1）遗传图谱的构建

染色体的交换与重组是遗传图谱构建的理论基础，通过作图群体的分析，如果一个基因与两侧最近的分子标记距离均在2 cM以上，就需要作精细的遗传图谱。因为即使是在小基因组水稻中，平均1 cM也相当于250 kb左右的物理距离，如果在着丝粒附近就可能相当于1000 kb左右，需要进行若干步的染色体步行，非常费时费力。因此，精细的遗传图谱对图位克隆显得非常重要，而增加遗传图谱上的分子标记数目是精细作图的基础。在一个已知区域内增加分子标记有两种方法，第一种方法是整合已有的遗传图谱。如将生理、生化、分子标记图在同一区域内整合在一起，就会提高分子标记的密度。另一种方法是寻找新的分子标记。在植物上，精细作图的发展速度超过了动物的同类研究，这主要是因为在植物上可很方便地建立和维持较大的分离群体，并建立了几种不同的检测标记间连锁关系的统计软件。现在，业已建图的植物已多达几十种，其中包括了所有重要的农作物(Tanksley，1995)，如玉米、番茄、水稻、小麦、大麦、燕麦、大豆、高粱、油菜、莴苣、马铃薯等。尤其值得一提的是，过去被公认为难以开展遗传作图的木本植物，如今也涌现出了许多密度可观的分子标记连锁图，如苹果和松树等。由于许多科学家的共同努力和连年的工作积累，已有越来越多生物的遗传图谱趋于饱和，这就为生物的物理图谱的构建奠定了基础。

（2）物理图谱的构建

由于分子标记与目标基因之间的实际距离是按碱基数(bp)来计算的，它会因不同染色体区域基因重组值不同而造成与遗传距离的差别，所以物理图谱是真正意义上的基因图谱。物理图谱的种类很多，从简单的染色体分带图到精细的碱基全序列都是物理图谱。最为常用的物理图谱有限制酶切图谱、跨叠克隆群和DNA序列图谱等。限制酶切图谱是用几种限制性内切酶消化DNA，通过电泳检查限制性片段长度的办法确定它们的排列顺序；对于较大的基因组，可以利用稀有切点限制性内切酶和脉冲电脉。制作跨叠克隆群则需具有一定容量的大片段基因组文库。比较各个克隆的插人片段，将它们排列成与原来在染色体中的顺序一样的连续克隆群，即跨叠克隆群(也叫重叠克隆群)。

跨叠克隆群的制作方法有三种：

1）菌落杂交法。其基本原理是利用基因组某一区域特有的或与所需分离的目标基因紧密连锁的DNA分子标记为探针筛选大片段基因组文库，可以分别得到一系列的阳性克隆，这些克隆之间有部分片段是重叠的，根据其重叠部分可以把它们有序地呈线状排列成跨叠群(contig)。在两个跨叠群之间会出现空隙，需要通过染色体步行来填补。该技术从分离大片段阳性克隆群的左、右末端人手，以它们为探针再次筛选基因组文库，获得新的克隆即为沿着染色体向前走了一步，重复这一过程，就能一步一步地将空隙填满，将两个克隆群整合在一起，这一方法能利用各种分子标记扫描文库，准确得到携带分子标记的阳性克隆，是构建跨叠克隆群的首选策略。

2）PCR法。即以PCR技术为基础发展了一系列技术，包括STS、RAPD、AFLP和Alu-PCR等已被广泛应用于跨叠克隆群的构建。STS策略是利用已知核酸序列，从两端合成两个与其配对的引物，利用PCR进行扩增，理论上讲具有相同扩增带型的克隆，也可以说共享一个或数个STS位标的克隆肯定是跨叠的。这个方法具有简便、快速、精确度高等优点，是人类基因组计划所采用的主要策略之一。另一重要的基于PCR的策略是A1u-PCR技术，该技术利用人类基因组的Alu重复序列，合成一对特异性引物，进行PCR扩增，然后以PCR产物为探针，从文库中筛选出阳性克隆。这一方法简便，但有时会出现一些误差，当与限制性内切酶物理图谱结合使用时，就可以比较精确地排列出阳性克隆的重叠顺序。

3）DNA指纹—锚标法。其原理是首先对随机克隆的DNA选定一个6碱基识别位点的限制性内切酶消化，然后用放射性同位素进行末端标记，经标记后DNA片段用另一个4个碱基识别位点的限制性内切酶消化，用序列分析胶分离这些片段，然后经放射性自显影检测。这些指纹图谱数据经计算机处理后，根据片段的相似性，构建跨叠克隆群。

荧光原位杂交技术(Fiber-FISH)是最近几年新发展的方法，它使FISH技术的分辨力接近其理论值1 Kb，在光学显微镜的识别范围内。Fiber-FISH适宜于基因组的数量作图，而且由于可以在荧光显微镜下同时观察几种探针的位置和顺序，将有效地排除染色体步行过程中经常遇到的复重序列带来的因难。这些物理图谱的构建，无疑给图位克隆感兴趣的基因奠定了坚实的基础。

（3）构建高质量的基因组文库

在基因的图位克隆技术中，高质量的基因组文库的构建也是克隆成功的另一关键。图位克隆的基因组文库主要有Cos质粒文库和人工染色体(YAC)文库。作为被克隆的载体。可以采用Cos质粒，它是1种含有λ噬菌体的cos位点的质粒载体，大小在10 kb左右，可高效地克隆25~35 kb的DNA片段。当要克隆大片段DNA时。需要YAC作载体，以YAC为载体，可将300~1000 kb的DNA片段克隆：因此，以YAC为载体可以构建高等植物的完整基因组文库。除YAC外。后来又陆续发展了BAC、PAC等几种以细菌为寄主的载体系统。

图位克隆在理论上适用于任何物种，但目前主要还是用于真核生物。真核生物一般都有内含子，一个基因往往长达几个到几十个kb，只有容纳大片段插入子克隆载体，才能携带完整的基因。柯斯质粒从λ噬菌体改造而来，由于采用质粒的复制子，柯斯质粒克服了包装的限制，插人片段可达40~50 kb。虽然如此，柯斯质粒还是不敷应用，就又发展了人工染色体技术。人工染色体在细胞周期中可以正常复制，配对和分离。作为载体，人工染色体的插入片段可达2 Mb左右，能够覆盖完整的真核基因。最早发展的人工染色体是酵母人工染色体（YAC）。1983年，Murray等首次构建了总长度为55 kb的YAC。1987年，Burke等得到了能够克隆大片段DNA的YAC载体，证明YAC可以构建高等生物的完整基因组文库。YAC具有比较大的容纳能力，但不太稳定，嵌合体比例也较高，而且难以与酵母自身的染色体分开。后来陆续发展了P1、BAC、PAC等几种以细菌为寄主的载体系统。值得一提的是进展一直缓慢的哺乳动物人工染色体(MAC)和人类人工染色体(HAC)也已取得突破性进展。找到与目标基因紧密连锁的分子标记(最好分布在基因两侧)和鉴定出分子标记所在的大片段克隆以后，接着是以该克隆为起点进行染色体步行，逐渐靠近目标基因，以该克隆的末端作为探针筛选基因组文库，鉴定和分离出邻近的基因组片段的克隆，再将这个克隆的远端末端作为探针重新筛选基因组文库。继续这一过程，直到获得具有目标基因两侧分子标记的大片段克隆或重叠群。如果目标基因所在区域已经完成分子作图，就有一套现成的顺序排列的大片段克隆可以利用。当遗传连锁图谱指出基因所在的特定区域时，即可取回需要的克隆，获得目标基因。

染色体步行的主要困难在于，当必须经过一个无法克隆的片段时(如对寄主无害)，步行的过程会被打断；当克隆的一端是重复序列时，步行的方向会步入歧途。为了克服这些困难，发展了染色体登陆、跳步和连接等方法。染色体登陆是找出与目标基因的物理距离小于基因组文库插入片段的平均距离还小的分子标记，通过筛选文库直接获得含有目标基因的克隆，完全避开染色体步行的过程。染色体跳步—连接是使用一个识别位点很少的随机一个识别位点很多的酶构建跳步文库和连接文库。跳步文库的插入片段是大片段克隆末端经过双酶切的部分，由同样的文库进行克隆。连接文库的插入片段是由切点较少的酶产生的，具有切点较少的那个酶的识别位点。在染色体步行的过程中，交替应用两个文库进行跳步和连接，最终逼近目标基因。筛选和鉴定目的基因是图位克隆技术的最后环节，找到与目的基因紧密连锁的分子标记并鉴定出分子标记所在的大片段克隆后，接着是以该克隆为起点进行染色体步行，逐渐靠近目的基因。当遗传连锁图谱指出基因所在的特定区域时，即可取回需要的克隆，获得目的基因。在与目的基因紧密连锁的分子标记及大插入片段基因组文库都具备的情况下，就可以以该分子标记为探针通过菌落杂交，蓝、白斑挑选的方式筛选基因组文库而获得可能含有因的基因的阳性克隆。在用覆盖目的基因区域的大片段基因组DNA克隆筛选区域特异的cDNA后，仍需对目的基因编码的cDNA作进一步证实。现有证实目的基因编码的cDNA克隆的方法有：1) 精细作图来证实某候选基因克隆与目标性状共分离； 2) 证实某候选基因克隆的时空表达模式与目标性状的表现相同；3）把候选基因序列与现有已知功能基因序列数据库进行同源性比较，推断其功能；4) 比较候选基因序列在野生型与突变型之间的差异，确定在二者之间变异的cDNA序列；5) 转化候选基因。

这些阳性克隆中可能含有多个候选基因，从一系列候选基因中鉴定基因是定位克隆技术的最后一个关键环节。现在最常用的方法是用含有目标基因的大片段克隆如BAC克隆或YAC克隆去筛选cDNA文库，并查询生物数据信息库，待找出候选基因后，把这些候选基因进行下列分析以确定目标基因：1) 精确定位法检查cDNA是否与目标基因共分离；2) 检查cDNA时空表达特点是否与表型一致；3) 测定cDNA序列，查询数据库，以了解该基因的功能；4) 筛选突变体文库，找出DNA序列上的变化及与功能的关系；5) 进行功能互补实验，通过转化突变体观察突变体表型是否恢复正常或发生预期的表型变化。功能互补实验是最直接、最终鉴定基因的方法。

写在前面

本次分享一篇于2020年发表在 Cell 上的paper， “A Bacterial Effector Mimics a Host HSP90 Client to Undermine Immunity” ，第一单位是美国德州西南医学中心。主要讲述了细菌的Type 3效应子HopBF1，具有激酶活性，能够磷酸化宿主的HSP90(分子伴侣蛋白，促进蛋白质折叠，包括免疫受体和免疫激酶；辅助NLR的激活；且在多个物种中广泛存在)，使其失活，最终阻止了免疫受体的激活，从而达到促进侵染的目的。

作者首先通过生物信息学的方式 (通过蛋白质结构和催化活性断定为激酶，而不是根据一级序列来判断为激酶) 以及人工注鉴定到一个细菌中的T3SS效应子-HopF1。HopF1在许多革兰氏阴性菌中都有，包括动植物的一些致病菌或共生菌。

比较HopBF1的161个homolog发现，它具有保守的蛋白激酶残基，包括结合ATP的高度保守的Gly残基、经典激酶PkA的活性位点Asp(F1A)。爱文氏菌(人体致病菌)的HopBF1与PKA的RMSD(一个结构相似性参数)为32埃(F1CD)，通过对各部分结构进行比对和解读后发现，HopBF1具有最小的非典型激酶结构域。

由于HopBF1的大多数homolog都出现在丁香假单胞菌中，因此主要采用丁香假单胞菌来研究其功能。烟草中表达HopBF1及其活性突变形式(D154A,D169A)，在WT中表现出强烈的病斑坏死，而突变体缺没有(F2AB)。为了查明HopBF1在侵染过程中是否会造成组织坏死(文章里这个地方是用的cell death来表示，我个人觉得不妥，因为植物里的cell death通常是和HR联系在一起，这里明显是想看病斑的大小，可能跟作者主要做医学有关)，在无效应子的丁香假单胞菌中分别表达这三种形式，然后侵染拟南芥和烟草，发现同样的病斑坏死现象(F2CD)。体外和体内试验共同说明HopBF1的激酶活性对它在拟南芥、烟草中造成病害是重要的。

之前报道细菌的效应子通常靶向真核生物保守的信号成分，而酿酒酵母通常用作效应子靶向底物的鉴定。将HopBF1及其突变形式转入酿酒酵母中发现，转入正常形式造成生长缺陷(F3A)。为了鉴定HopBF1潜在的底物，将HopBF1及其突变形式与酵母提取物混合孵育，同位素示踪试验发现，正常形式的HopBF1在80kDa附近有明显的条带(F3B)。酵母中转入flag-HopBF1，IP-MS鉴定到80kDa附近的带是HSP82/HSC82(F3C)，是人的HSP90在酵母里面的homolog。Co-IP验证了其可以互作(F3D)。

体外磷酸化试验证明，HopBF1能磷酸化HSP82(F3E)，来自多种菌的HopBF1也能磷酸化HSP82(当然也有不能磷酸化的)，同样，丁香假单胞菌的HopBF1也能磷酸化小麦的HSP90和人的HSP90β(F3F)，但不能磷酸化Ecoli和丁香假单胞菌的HSP90(F3G)。HopBF1的激酶活性似乎是特异的，因为它不能磷酸化通用磷酸化底物myBP和casein(F3H)。因此，HopBF1似乎是一个针对真核HSP90的激酶。

MS鉴定到HSP90的磷酸化位点是Ser99和Thr101(F4A)Ser99突变后，HSP90不能被磷酸化；Thr101突变后，磷酸化不受影响(F4B)。Ser99在HSP90家族是保守的，控制了HSP90和ATP的结合(F4 CD)。HopBF1与HSP90共孵育后或组成型激活形式的HSP90（S99E）减少了分子伴侣的ATP酶的功能，与HSP90抑制剂- geldanamycin发挥的作用一致(F4E)。

接下来作者想看HSP90分子伴侣的功能是否受磷酸化影响，在哺乳细胞中共转HopBF1和两个HSP90客户(v-src(肿瘤酪氨酸激酶);内源免疫受体NLRP3)，发现v-src酪氨酸磷酸化水平和蛋白水平、NLRP3的蛋白水平都减少了(F4FG)。这也就说明，HopBF1磷酸化HSP90，磷酸化后的HSP90丧失了ATPase和分子伴侣功能。

作者为了探究HopBF1的催化功能，创造了多种突变体，其中离子对残基E74A突变后，HopBF1在酵母中的生长缺陷作用减弱(F4I)。在转入HopBF1的酵母中过表达HSP90不能恢复其生长缺陷，可能是因为HopBF1在催化方面起作用(F4H)。这些结果就说明HopBF1在酵母中引发的生长缺陷是磷酸化HSP90，让其失活的结果。

使用表达HopBF1及其活性突变形式的丁香假单胞菌侵染过表达HSP90的烟草叶片，结果发现叶片在3天时出现病斑，6天扩大(F5A)。而表达 HSP90 S100F(磷酸化位点突变)或YFP 被丁香假单胞菌侵染，有显著减小的病斑(F5A)。过表达HSP90，而不是S100F加快了病斑的形成，这就说明提升HSP90的Ser100 水平也许对植物是有毒的。总之，这说明HSP90Ser100 在侵染过程中被HopBF1磷酸化。

植物中，NLR的激活，如RPM1，需要HSP90。因此作者推断HopBF1失活HSP，阻止了RPM1的激活。瞬时表达RPM1 D505V(自激活形式)引发了HR(F5B)，共表达RPM1 D505V和HopBF1减少了HR。这就说明HopBF1通过磷酸化失活HSP90干扰了RPM1 D505V的激活，从而阻止了HR。

因为HopBF1和HSP90互作，所以想看看HopBF1是否能作为HSP90的“客户蛋白”。

在293细胞中表达HopBF1 D170A(失活形式),并用HSP90的抑制剂处理，发现293细胞系中抑制HSP90后，HopBF1 D170A的和v-src的蛋白水平都减少(F4A)。

真核生物中，HSP90一般共分子伴侣蛋白CDC91一同发挥作用，促进客户激酶的成熟。Co-IP发现，HSP90和CDC37与v-src互作，但是在HopBF1的IP产物中并没有检测到CDC37(F6B)。沉默CDC37后，影响了HSP90和v-src互作，但不影响HopBF1和HSP90的互作(F6C)。这就说明HopBF1与HSP90互作时并不需要CDC37

客户蛋白激酶的αC-β4 loop在被HSP90识别时发挥重要作用，突变这个区域后(V89D )，发现HopBF1对酵母生长缺陷的表型极大减少了。在细菌中表达HopBF1 V89D，能检测到蛋白；而在哺乳细胞中表达HopBF1 V89D 时，WB并没有检测到，因为不适当地靶向HSP90会被蛋白酶体途径降解(F6E)，施加MG132后又能检测到蛋白，说明HopBF1 V89D确实被蛋白酶体途径降解了。

为了查明HopBF1 V89D在植物中的作用，在丁香假单胞菌中转入HopBF1正常形式和突变形式，然后侵染烟草，发现表达正常的HopBF1造成极大的组织坏死，而HSP90的互作突变体HopBF1 V88D或活性突变体D169A并没有造成组织坏死，总的来说，HopBF1模拟作为HSP90的客户。

后记

1对于HopF1的发现，使用的生物信息学工具还是蛮有意思的，后面如果有时间可以尝试复现一下。

3酵母是个好兄弟，可以拿来做真核保守性的开胃菜；还能用其筛选保守的互作蛋白。

2020年12月9日，德国马克斯-普朗克植物育种研究所 Ruben Garrido-Oter 和 Paul Schulze-Lefert 团队在 Cell Host & Microbe 上发表了题为 Root-secreted coumarins and the microbiota interact to improve iron nutrition in Arabidopsis 的研究性论文。该研究揭示了拟南芥根系分泌的香豆素和根际微生物群落之间的互作可以显著改善铁胁迫条件下拟南芥对铁的利用。

1 前言

铁是植物生长发育所必须的大量元素，在植物光合作用和呼吸作用等生物进程中起着重要作用。尽管土壤中铁元素的含量很高，但是其生物活性通常较低。铁的缺乏会导致植物生长发育受阻、叶片黄化甚至产量降低。为了适应铁生物活性较低的环境，一些非禾本科植物（比如拟南芥， Arabidopsis thaliana ）会通过酸化根际环境（H+-ATPase AHA2）将Fe3+还原为Fe2+（FERRIC REDUCTION OXIDASE2，FRO2）来提高铁的利用率。上述过程会受到FIT转录因子（FER-LIKE IRON DEFICIENCYINDUCED TRANSCRIPTION FACTOR）和一系列相关的bHLH转录因子调节。Fe2+则会被IRT1转运蛋白（IRON-REGULATED TRANSPORTER1）转运到根表皮内。

有研究发现，植物铁胁迫会诱导根系分泌香豆素，并且认为香豆素有助于活化难以活化的铁库。也有研究表明，在钙质土壤和培养基条件下，香豆素会影响根际微生物群落结构。在拟南芥中，三种香豆素的合成是一个线性的生物合成进程（图1）。莨菪亭素（scopoletin）由FERULOYL-COA6-HYDROXYLASE1（F6’H1）催化合成，随后会被SCOPOLETIN 8-HYDROXYLASE（S8H）转化为秦皮素（fraxetin），进一步被CYTOCHROME P450 FAMILY82C4（CYP82C4）催化形成sideretin。这三种香豆素均可被ABC转运蛋白PLEIOTROPIC DRUG RESISTANCE9（PDR9）运出体外。当然也有一些其它途径转运香豆素被发现。然而，在不同养分活性条件下（主要是可利用铁），香豆素对根际微生物群落结构和植物生产力的影响仍不明确。

2 材料和方法

21 试验材料

土壤：试验所用土壤主要来自两个地方。科隆农业土壤（CAS）是从德国科隆（GPS code: 50958 N, 6856 E）收集的，该地区已经有15年以上未进行农业活动。意大利土壤（IS）是从意大利有机葡萄园（GPS code: 44292 N, 11784 E）收集的，该葡萄园从2007年起未进行过施肥和灌溉。收集的土壤混匀过筛后储存在4℃。二者主要理化性质的差异见图2。

植物材料：试验所用拟南芥突变体材料均以哥伦比亚野生型为背景。具体材料及突变位点见表1。

菌株：试验所用115株菌株均为Bai et al （2015）从拟南芥CAS根际土壤中分离，保存在20%甘油中。活化和培养使用TSA和TSB培养基。

表 1 试验所用植物材料

22 试验设计

本试验内容主要分为两个大类：土壤试验和平板试验。

土壤试验是以CAS和IS土壤为基质，主要探究土壤中不同可利用铁对拟南芥香豆素合成运输突变体生长的影响。灭菌的拟南芥种子发芽后播种在7 × 7 cm的方盆内，盆栽放置于温室内，播种后37天取样。测定拟南芥地上部鲜重、叶绿素含量和根系细菌群落。

伯克氏菌科菌株对香豆素敏感性试验是在96孔培养板完成，测定香豆素对细菌生长的影响。

平板试验中种子表面消毒后置于无菌的水琼脂平板上催芽。改良的1/2 MS培养基用于拟南芥幼苗生长，培养基分别添加Fe3+-EDTA和FeCl3来模拟土壤中铁的活性，最终平板pH为74以减少酸性环境对铁的溶解。人工菌群是将115株菌株培养12-18 h后（代谢旺盛时期），分别用300μl MgCl2重悬，随后混合接种于平板中（OD600 = 01），对照则加入等量的灭活的混合菌液。6天苗龄的拟南芥用于平板试验，生长8天后取样。测定拟南芥地上部鲜重、叶绿素含量、地上部铁含量和根系转录组。筛选的53株单独接种的菌株则在OD600 = 01时用于试验，取样后仅测定地上部鲜重。

外源香豆素对拟南芥野生型和突变体生长的影响试验则是在改良的1/2 MS培养基中分别添加莨菪亭素和秦皮素，取样后测定地上部鲜重来评价其对植株生长的影响。

23 指标测定

拟南芥地上部鲜重、叶绿素含量、地上部铁含量、16S rRNA基因测序（V5-V7）和根系转录组。

3 结果

31 在缺铁土壤中，香豆素对植株生长和根系微生物组成是重要的

在CAS和IS土壤中分别种植野生型拟南芥和4种香豆素合成运输突变体材料，结果发现在铁胁迫条件下（IS）， f6’h1 和 s8h 突变体植株地上部鲜重和叶绿素含量比野生型显著降低。在CAS土壤中则未观察到该现象，说明香豆素对植株铁营养有重要作用（图3）。16S rRNA基因测序结果表明，在IS土壤中， f6’h1 和 s8h 突变体与其它基因型细菌群落存在显著差异。相反地，在CAS土壤中，各个基因型拟南芥根系微生物群落组成则十分相似（图4）。以上这些结果都表明，在低活性铁土壤中，香豆素（尤其是莨菪亭素和秦皮素）对植物生长和根系微生物群落组成具有重要作用。

32 香豆素可以重塑根系微生物

与野生型相比，在不同土壤中，各香豆素合成运输突变体的差异富集的扩增子序列变异（differently enriched amplicon sequence variants，deASVs）存在差异，尤其是 f6’h1 突变体（图5A）。对IS土壤中 f6’h1 突变体deASV序列分析发现，显著差异主要集中在伯克氏菌科、根瘤菌科和链霉菌科，且伯克氏菌科的deASV数量最多（图5B）。这些现象表明香豆素可以通过改变细菌群落组成（ASV水平上）来重塑根系微生物群落。比较两种土壤中 f6’h1 突变体和野生型的上述三个科的相对丰度发现，伯克氏菌科虽然占比最高，但是在野生型与突变体间无显著差异，而根瘤菌科和链霉菌科则在IS土壤中存在显著差异（图5C）。伯克氏菌科在野生型和突变体间无显著差异可能是由于分类水平较高导致的。

此外，部分香豆素复合物被认为具有拮抗微生物活性的功能，本试验也检测了一些共生的拟南芥根际微生物对香豆素的敏感性。结果发现秦皮素对大部分伯克氏菌的生长有显著抑制，而莨菪亭素对较少的菌株存在显著抑制（图5D）。

注：图5D中S与F分别代表添加50 μM莨菪亭素或者秦皮素后，该株系生长与对照间存在显著差异。

33 人工菌群和铁的活性对拟南芥生长的影响

Bai et al （2015）筛选的115株拟南芥根际细菌主要属于放线菌门和变形菌门（图6A）。这些菌株用于构建人工菌群来模拟自然环境中拟南芥根际微生物群落，从而检测在铁胁迫条件下根际微生物对拟南芥生长的影响。试验结果发现，在可利用铁充足的条件下，根际微生物对拟南芥生长（地上部生物量）无显著影响；相反地，在铁胁迫条件下，添加人工菌群则对拟南芥生长有显著促进作用（图6B和6C）。这种现象可能是香豆素抑制了部分共生菌的活性引起的。

为了鉴定不同菌株对植株缺铁的影响，本试验挑选了53株菌株进行单独接种。结果发现，在相同分类水平下，不同菌株对能否改善植株铁养分表现存在明显差异（图6D）。这说明微生物改善植株生长的功能存在冗余，并且具有菌株特异性。

注：（A）人工菌群的系统发育树。图中红色箭头表示用于图D的菌株。（B）不同形式铁养分下，接种人工菌群对拟南芥生长的影响。（C）不同形式铁养分对拟南芥地上部生物量和叶绿素含量的影响。（D）单独接种时，各菌株对拟南芥地上部生长的影响。，，表示在 P < 005，001，0001水平下存在显著差异。

34 微生物调控拟南芥生长需要根系转运铁和分泌香豆素

为了确定微生物改善拟南芥的生长是通过改善其对铁养分的利用实现的，本试验选取了4种与铁调节相关的拟南芥突变体，其中 fro2 与 irt1 负责转运Fe2+， aha2 可以酸化根际环境， bts 是铁胁迫响应的负反馈调节基因。试验中发现，在铁胁迫环境中接种人工菌群时，野生型拟南芥地上部鲜重和叶绿素含量有显著提升； fro2 与 irt1 突变体植株长势更差并且叶片黄化； aha2 突变体生长有一定改善，但是与相应野生型相比无显著差异； bts 突变体对缺铁耐受力更强，接种对其生长有一定促进（图7）。此外，在可利用铁充足时，接种对各突变体的生长均无显著影响（图8）。这些结果再次证实了缺铁会导致植株生长缓慢，且微生物改善植株生长需要依赖植株自身的铁吸收系统。

在前期试验发现缺铁土壤中，仅 f6’h1 和 s8h 突变体地上部生物量显著降低，表明香豆素（尤其是莨菪亭素和秦皮素）对细菌调节植株对铁吸收是必须的（图3）。为了进一步验证该结果，本试验外源添加了莨菪亭素和秦皮素来观测其对拟南芥生长的影响。结果表明，添加秦皮素对可以显著增加 f6’h1 地上部生物量和叶绿素含量，而单独添加莨菪亭素则对 f6’h1 生长无显著影响（图9A和9B）。这说明拟南芥可能无法吸收外源莨菪亭素。 F6’h1 和 s8h 突变体在同时添加莨菪亭素和秦皮素均可提高植株地上部生物量（图9C）。这些结果表明秦皮素对调控缺铁环境中拟南芥与微生物间的互作从而改善植株生长是必须的。

35 香豆素和微生物互作可以减轻植株铁胁迫

试验中发现在铁胁迫条件下，添加人工菌群可以显著提高野生型拟南芥的铁含量，而对 f6’h1 突变体则无改善；当可利用铁充足时，野生型和突变体间无显著差异（图10A）。这些结果说明微生物促进缺铁环境中植株生长是通过改善植株铁营养。

为了验证在缺铁环境中微生物改善植株生长是增强植株铁胁迫响应机制还是提高可利用铁含量，本试验分析了野生型和 f6’h1 突变体拟南芥根系转录组的差异。PCA分析发现铁的可利用性和人工菌群是影响植株基因表达的最主要因素，分别可以解释18%和9%的变异。在可利用铁条件下，是否接种人工菌群可以将植株转录组样本完全区分开来；在铁胁迫条件下，各转录组样本间的差异则由人工菌群和植株基因型共同决定。值得注意的是，在铁胁迫条件下， f6’h1 突变体接种人工菌群的转录组样本与野生型间存在显著差异，并且野生型样本与可利用铁条件下接种人工菌群样本更为相似（图10B）。铁胁迫条件下， f6’h1 突变体比野生型鉴定出更多与铁胁迫相关的差异表达基因；类群4中大量基因在铁胁迫条件下表达上调，而类群8中则存在大量铁胁迫表达下调的基因（图10C）。将本试验GO注释结果与之前报道的结果进行对比发现，之前鉴定的12个铁胁迫表达上调基因中11个均属于类群4；13个铁胁迫表达下调基因中7个属于类群8（表2）。此外，铁胁迫也会激活部分胁迫响应基因的表达。对部分铁胁迫响应基因的分析发现，基因的表达不仅与铁胁迫相关，也与是否添加人工菌群相关（图10D）。这些结果表明植株响应铁胁迫会受到香豆素和根际微生物群落的影响。

表 2 本试验转录组 GO 注释结果与之前报道的缺铁响应关键基因的对比

4 结论

植物受益于多样化的根际微生物群落。了解这些有益微生物的机制对提高植物生产力有着重要意义。本研究探究了在铁胁迫条件下，拟南芥和根际微生物之间依赖植物分泌的香豆素的有益的相互作用。破坏这一途径会改变根际微生物群落并抑制铁胁迫土壤中的植物生长。此外，根际微生物群落改善植株生长取决于植物铁的转运和植株分泌的香豆素（主要是秦皮素）。植物和微生物间的有益互作是具有菌株特异性的，但在微生物群落的系统发育中是功能冗余的。根系转录组和元素分析表明，共生体和香豆素之间的相互作用可以改善植物铁营养来促进其生长。这些结果表明，香豆素通过激发微生物辅助的铁营养途径改善了植物的生长。我们认为，在香豆素的刺激下，植株根际微生物群落是植物适应铁胁迫土壤的重要媒介。

编辑∣冯曾威

审核∣姚青

广东省科学院微生物研究所菌种组-华南农业大学园艺学院土壤微生物组联合团队

aaegff3 Aedes aegypti 埃及伊蚊

acagff3 Anolis carolinensis 变色龙

agagff3 Anopheles gambiae 冈比亚按蚊

amegff3 Apis mellifera 意蜂

apigff3 Acyrthosiphon pisum 豌豆蚜

athgff3 Arabidopsis thaliana 拟南芥

bdigff3 Brachypodium distachyon 短柄草

bflgff3 Branchiostoma floridae 真红藻

bmogff3 Bombyx mori 家蚕

bnagff3 Brassica napus 油菜

btagff3 Bos taurus 牛

cbrgff3 Caenorhabditis briggsae 新杆状线虫

celgff3 Caenorhabditis elegans 秀丽隐杆线虫

cfagff3 Canis familiaris 家犬

cingff3 Ciona intestinalis 玻璃海鞘

cqugff3 Culex quinquefasciatus 致乏库蚊

cregff3 Chlamydomonas reinhardtii 莱茵衣藻

crmgff3 Caenorhabditis remanei 线虫

csagff3 Ciona savignyi 海鞘

ctegff3 Capitella teleta 海蠕虫

dangff3 Drosophila ananassae 嗜凤梨果蝇

ddigff3 Dictyostelium discoideum 盘基网杆菌

dergff3 Drosophila erecta 果蝇

dgrgff3 Drosophila grimshawi 果蝇

dmegff3 Drosophila melanogaster 黑腹果蝇

dmogff3 Drosophila mojavensis 果蝇

dpegff3 Drosophila persimilis 果蝇

dpsgff3 Drosophila pseudoobscura 拟暗果蝇

dpugff3 Daphnia pulex 蚤状溞

dregff3 Danio rerio 斑马鱼

dsegff3 Drosophila sechellia 果蝇

dsigff3 Drosophila simulans 拟果蝇

dvigff3 Drosophila virilis 果蝇

dwigff3 Drosophila willistoni 果蝇

dyagff3 Drosophila yakuba 果蝇

ebvgff3 Epstein Barr virus EB病毒

ecagff3 Equus caballus 家马

egrgff3 Echinococcus granulosus 细粒棘球绦虫

emugff3 Echinococcus multilocularis 多房棘球绦虫

frugff3 Fugu rubripes 红鳍东方鲀

ggagff3 Gallus gallus 原鸡

ggogff3 Gorilla gorilla 大猩猩

gmagff3 Glycine max 大豆

hcmvgff3 Human cytomegalovirus 人源巨细胞病毒

hmegff3 Heliconius melpomene 红带袖蝶

hsagff3 Homo sapiens 人

iscgff3 Ixodes scapularis 肩突硬蜱

kshvgff3 Kaposi sarcoma-associated herpesvirus Kaposi肉瘤病毒

lgigff3 Lottia gigantea 霸王莲花青螺

mdmgff3 Malus domestica 苹果

mdogff3 Monodelphis domestica 短尾负鼠

mdv1gff3 Mareks disease virus 马立克氏病毒

mghvgff3 Mouse gammaherpesvirus 68 γ-疱症病毒 68 老鼠

mmlgff3 Macaca mulatta 猕猴

mmugff3 Mus musculus 小鼠

mtrgff3 Medicago truncatula 蒺藜苜蓿

nvegff3 Nematostella vectensis 海葵

nvigff3 Nasonia vitripennis 蝇蛹金小蜂

oangff3 Ornithorhynchus anatinus 鸭嘴兽

olagff3 Oryzias latipes 青鳉，稻田鱼

osagff3 Oryza sativa 水稻

ppcgff3 Pristionchus pacificus 线虫

pptgff3 Physcomitrella patens 小立碗藓

ppygff3 Pongo pygmaeus 猩猩

ptcgff3 Populus trichocarpa 毛果杨

ptrgff3 Pan troglodytes 黑猩猩

rcogff3 Ricinus communis 蓖麻

rnogff3 Rattus norvegicus 大鼠

rrvgff3 Rhesus monkey rhadinovirus 恒河猴疱疹病毒

sbigff3 Sorghum bicolor 高粱

shagff3 Sarcophilus harrisii 袋獾

sjagff3 Schistosoma japonicum 日本血吸虫

slygff3 Solanum lycopersicum 番茄

smagff3 Schistosoma mansoni 曼氏血吸虫

smegff3 Schmidtea mediterranea 真涡虫

spugff3 Strongylocentrotus purpuratus 紫色球海胆

sscgff3 Sus scrofa 猪

taegff3 Triticum aestivum 小麦

tcagff3 Tribolium castaneum 赤拟谷盗

tgugff3 Taeniopygia guttata 斑胸草雀

tnigff3 Tetraodon nigroviridis 青斑河豚

vvigff3 Vitis vinifera 葡萄

xtrgff3 Xenopus tropicalis 非洲蟾蜍

zmagff3 Zea mays 玉米

BZR（BRASSINAZOLE-RESISTANT）家族基因是编码参与油菜素内酯信号转导的植物特异性转录因子，在植物生长中起着至关重要的作用。

今天我就给大家带来一篇甜菜中BZR基因家族分析的文章。文章于2019年5月9日在线发表在BMC Plant Biology（影响因子393，中科院分区二区）。

具体分析内容如下：

一、甜菜中 BvBZR 基因的鉴定

通过鉴定，共鉴定出6个BvBZR基因： Bv5_cuzi 、 Bv_epwr 、 Bv1_fxre 、 Bv6_nyuw 、 Bv1_qnjn 、 Bv_yfzt 。

二、Motif分析和系统发育分析

为了阐明BZR家族的进化关系，作者基于来自甜菜、拟南芥、水稻和大白菜的41个BZR家族成员的氨基酸序列构建了系统发育树，并进行了motif分析。

三、 BvBZR 基因染色体分布和基因结构分析

作者将鉴定的6个 BvBZR 基因定位到了甜菜基因组的5条染色体上，并对基因结构进行了分析。

四、 BvBZR 基因的顺势作用原件分析

五、不同甜菜品种根茎的生长特征规律统计

作者统计了包括主根的生长曲线（根重）、主根的生长速度、主根的含糖量以及主根含糖量的增加速率4个指标。

六、与甜菜生长特征相关的基因表达模式和相关性分析

七、 BvBZR 基因在E型和Z型根、茎、叶组织中表达模式分析

八、 BvBZR 基因对植物激素响应的基因表达模式分析

为了研究 BvBZR 基因的表达水平是否受外源植物激素的调节，作者对甜菜根喷洒了IAA、ABA、MeJA、GA3共4种植物激素，并检测了 BvBZR 基因的表达水平。

九、 BvBZR 基因的亚细胞定位

作者首先使用Wolf PSORT软件对 BvBZR 基因进行亚细胞定位预测，并采用实验手段对预测结果进行了验证。

总结

到此为止，这篇基因家族类文章的所有分析就完成了，在内容上还是比较常规的，只是在实验方面补充了因的亚细胞定位实验和一些生长指标，并没有复杂的实验 *** 作和分析内容，值得大多数研究者借鉴！

分子层面对生物的研究，在个体水平上主要是看单个基因的变化以及全转录本的变化（RNA-seq）；在对个体的研究的基础上，开始了群体水平的研究。如果说常规的遗传学主要的研究对象是个体或者个体家系的话，那么群体遗传学则是主要研究由不同个体组成的群体的遗传规律。

在测序技术大力发展之前，对群体主要是依靠表型进行研究，如加拉巴哥群岛的13中鸟雀有着不同的喙，达尔文认为这是自然选择造成的后果。达尔文的进化论对应的观点可以简单概括为“物竞天择，适者生存”，这也是最为大众所接受的一种进化学说。直到1968年，日本遗传学家提出了中性进化理论[2]，也叫中性演化理论。中性理论的提出很大程度上是基于分子生物化学的发展。可以这样理解中性理论：一群人抽奖，在没有内幕的情况下，每个人抽到一等奖的概率是相等的，这个可能性和参与抽奖的人的身高、年龄、爱好等因素都没有关系。中性理论常作为群体遗传研究中的假设理论（CK）来计算其他各种统计指标。

群体遗传学，研究的单位是群体，比如粳稻、籼稻、野生稻，就能够构成不同的群体；我们国内的各省份的水稻也可以作为一个个群体。群体遗传学大概可以分为群体内的研究和群体间的研究。比如研究云南元阳的水稻的遗传多样性；如果研究是的云南元阳的水稻和东北的水稻，那就可以算成是群体间的研究。群体间和群体内的研究是相互的。

测序价格的急剧下降[3]使得大规模的群体测序得以实现。

常见的变异类型有SNP、IdDel、SV、CNV等。重测序中最关注的是SNP，其次是InDel。其他的几种结构变异的研究不是太多。

有参考基因组的物种的全基因组测序叫做重测序，没有参考基因组的物种的全基因组测序则需要从头组装。随着测序价格的降低，越来越多物种的参考基因组都已经测序组装完成。 plant genomes [4]网站实时显示全基因组测序已经完成的植物，其中2012年以后爆发式增长。在群体遗传学研究中更多的是有参考基因组的物种，尤其是模式物种，植物中常见的是拟南芥、水稻和玉米。

主要的分析流程见下图。现在的测序公司基本上都会帮客户完成整个的分析流程，因为主要耗费的资源是计算资源。我认为在整个分析的流程中最重要的是Linux目录的构建，混乱的目录会导致后续的分析频频出问题，重测序分析会生成很多的中间文件，良好的目录管理会使得项目分析流程井然有序。

该部分涉及到的软件的安装和基础的Linux基础知识就不详细说明了。

正选择似乎可以更好地用自然选择来解释。就是一个基因or位点能够使个体有着更强的生存力或者是育性，这样就会使得这个个体的后代更多，如此一来，这个基因or位点在群体中就越来越多。

正选择能够使有利的突变基因or位点在群体中得到传播，但是与此同时却降低了群体的多态性水平。也就是说原先该位点周围的核苷酸组成是多样性的，在经过正选择之后，这个位点周围核苷酸的多样性就渐渐的趋于同质化了。这就好比一块田，里面本来有水稻和稗草及其他杂草，由于稗草的适应性增强，稗草在逐渐增多，水稻慢慢变少，最后甚至是只剩下了稗草。

我们将这种选择之后多态性降低的情况叫做选择扫荡（Selective Sweep)。检测选择扫荡的软件有SweeD[7]。选择扫荡有可能是人工选择的结果，如2014年 Nature Genetics关于非洲栽培稻的文章就使用了SweeD来检测非洲栽培稻基因组上受人工选择的区域[8]。

负选择和正选择刚好是相反的。简单理解成群体中的某个个体出现了一个致命的突变，从而自己或者是后代从群体中被淘汰。这也导致群体中该位点的多态性的降低。就好比我有10株水稻，其中一株在成长过程中突然不见了，那么对我的这个小的水稻群体来说，这个消失的水稻的独有的位点在群体中就不见了，整体的多态性就降低了。

平衡选择指多个等位基因在一个群体的基因库中以高于遗传漂变预期的频率被保留，如杂合子优势。

平衡选择检测的算法有BetaScan2[10]，这是个Python脚本，输入文件只需要过滤好的SNP数据即可。

计算公式为：

其中是有效群体大小，是每个位点的突变速率。但是群体大小往往是无法精确知道的，需要对其进行估计。

分离位点数是的估计值，表示相关基因在多序列比对中表现出多态性的位置。计算公式为：

其中为分离位点数量，比如SNP数量。

为个体数量的倒数和：

指的是核苷酸多样性，值越大说明核苷酸多样性越高。通常用于衡量群体内的核苷酸多样性，也可以用来推演进化关系[11]。计算公式为：

可以理解成现在群体内两两求，再计算群体的均值。计算的软件最常见的是 vcftools ，也有对应的R包 PopGenome 。通常是选定有一定的基因组区域，设定好窗口大小，然后滑动窗口进行计算。

3KRGP文章就计算了水稻不同亚群间4号染色体部分区域上的值[12]，能够看出控制水稻籽粒落粒性的基因 Sh4 位置多态性在所有的亚群中都降低了。说明这个基因在所有的亚群中都是受到选择的，这可能是人工选择的结果。

Tajima's D是日本学者Tajima Fumio 1989年提出的一种统计检验方法，用于检验DNA序列在演化过程中是否遵循中性演化模型[14]。计算公式为：

D值大小有如下三种生物学意义：

叫固定分化指数，用于估计亚群间平均多态性大小与整个种群平均多态性大小的差异，反映的是群体结构的变化。其简单估计的计算公式为：

的取值范围是[0,1]。当时，表明亚群间有着明显的种群分化。

在中性进化条件下，的大小主要取决于遗传漂变和迁移等因素的影响。假设种群中的某个等位基因因为对特定的生境的适应度较高而经历适应性选择，那该基因的频率在种群中会升高，种群的分化水平增大，使得种群有着较高的值。

值可以和GWAS的结果一起进行分析，超过一定阈值的区域往往和GWAS筛选到的位点是一致的，如2018年棉花重测序的文章[15]：

ROD可以基于野生群体和驯化群体间核苷酸多态性参数的差异识别选择型号，也可以测量驯化群体和野生型群体相比损失的多态性。计算公式为：

和一样，ROD也可以和GWAS结合起来：

群体结构分析可以简单理解成采样测序的这些个体可以分成几个小组，以及给每个个体之间的远近关系是怎么样的。群体结构分析三剑客，分别是进化树、 PCA 和群体结构图。

进化树就是将个体按照远近关系分别连接起来的图。

常用的绘图软件是 Phylip 和 Snpphylo 。进化树修饰的软件有 MEGA ， ggtree 等，推荐网页版工具 iTOL ，无比强大。

外群定根法：当群体的个体的差异很小时，可以引入其他物种作为根。如在对三叶草建树时可以引入水稻的序列作为根进行建树。

PCA是很常见的降维方法，如微生物研究中常用来检验样品分群情况。PCA计算的软件很多，plink可以直接用vcf文件计算PCA，R语言也可以进行PCA计算。

PCA图在群体重测序中有如下几种作用：

进化树和PCA能够看出来群体是不是分层的，但是无法知道群体分成几个群合适，也无法看出群体间的基因交流，更无法看出个体的混血程度。这时候就需要群体分层图了。

可以将进化树和群体分层图结合进行展示，如下图：

先了解下概念，此处借鉴基迪奥生物网站的解释[22]。

要理解 LD 衰减图，我们就必须先理解连锁不平衡（Linkage disequilibrium，LD）的概念。连锁不平衡是由两个名词构成，连锁 + 不平衡。前者，很容易让我们产生概念混淆；后者，让这个概念变得愈加晦涩。因此从一个类似的概念入手，大家可能更容易理解 LD 的概念，那就是基因的共表达。

基因的共表达，通常指的是两个基因的表达量呈现相关性。比较常见的例子就是：转录组因子和靶基因间的关系。因为转录因子对它的靶基因有正调控作用，所以转录因子的表达量提高会导致靶基因的表达量也上调，两者往往存在正相关关系。这个正相关关系，可以使用相关系数来度量，这个数值在 - 1~1 之间。总而言之，相关性可以理解为两个元素共同变化，步调一致。

类似的，连锁不平衡（LD）就是度量两个分子标记的基因型变化是否步调一致，存在相关性的指标。如果两个 SNP 标记位置相邻，那么在群体中也会呈现基因型步调一致的情况。比如有两个基因座，分别对应 A/a 和 B/b 两种等位基因。如果两个基因座是相关的，我们将会看到某些基因型往往共同遗传，即某些单倍型的频率会高于期望值。

参照王荣焕等[23]的方法进行LD参数计算：

随着标记间的距离增加，平均的LD程度将降低，呈现出衰减状态，这种情况叫LD衰减。LD衰减分析的作用：

GWAS(genome-wide association study)，全基因组关联分析，常用在医学和农学领域。简单理解成将SNP等遗传标记和表型数据进行关联分析，检测和表型相关的位点，然后再倒回去找到对应的基因，研究其对表型的影响。这些被研究的表型在医学上常常是疾病的表型；在农学上常常是受关注的农艺性状，比如水稻的株高、产量、穗粒数等。GWAS思想首次提出是在心肌梗塞的治疗上[24]，首次应用是在2005年的文章上[25]。

目前使用最广泛的模型是混合线性模型[26]：

所有的参数软件（如Emmax）会自动完成计算。

GWAS结果文件通常只有两个图，一个是曼哈顿图，另外一个是Q-Q图。一般是先看Q-Q图，如果Q-Q正常，曼哈顿图的结果才有意义。

MSMC（multiple sequentially Markovian coalescent）[27]，底层算法很复杂，类似于PSMC。MSMC的主要功能是推断有效群体大小和群体分离历史。

这样看起来更直观：

LAMP(Local Ancestry in Admixed Populations，混杂群体的局部族源推断)，用于推断采用聚类的方法假设同时检测的位点间不存在重组情况，对每组相邻的 SNP 进行检测分析[28]，在运算速度和推断准确度上都有了质的飞跃。

用于推断群体分离和混合[29]。图是这样的：

测序方案关系到后续的分析，不同的样本量对应不同的测序方法和分析方法。

[1] 自然选择(维基百科)

[2] Kimura, Motoo "Evolutionary rate at the molecular level" Nature 2175129 (1968): 624-626

[3] 测序价格变化趋势

[4] plant genomes

[5] DePristo, Mark A, et al "A framework for variation discovery and genotyping using next-generation DNA sequencing data" Nature Genetics 435 (2011): 491

[6] Biswas, Shameek, and Joshua M Akey "Genomic insights into positive selection" TRENDS in Genetics 228 (2006): 437-446

[7] Pavlidis, Pavlos, et al "Sweed: likelihood-based detection of selective sweeps in thousands of genomes" Molecular biology and evolution 309 (2013): 2224-2234

[8] Wang, Muhua, et al "The genome sequence of African rice (Oryza glaberrima) and evidence for independent domestication" Nature Genetics 469 (2014): 982

[9] Bamshad, Michael, and Stephen P Wooding "Signatures of natural selection in the human genome" Nature Reviews Genetics 42 (2003): 99

[10] Siewert, Katherine M, and Benjamin F Voight "BetaScan2: Standardized statistics to detect balancing selection utilizing substitution data" BioRxiv (2018): 497255

[11] Yu, N; Jensen-Seaman MI; Chemnick L; Ryder O; Li WH (March 2004) Genetics 166 (3): 1375–83

[12] Wang, Wensheng, et al "Genomic variation in 3,010 diverse accessions of Asian cultivated rice" Nature 5577703 (2018): 43

[13] Li, C, Zhou, A & Sang, T Rice domestication by reducing shattering Science 311, 1936–1939 (2006)

[14] Tajima, Fumio "Statistical method for testing the neutral mutation hypothesis by DNA polymorphism" Genetics 1233 (1989): 585-595

[15] Du, Xiongming, et al "Resequencing of 243 diploid cotton accessions based on an updated A genome identifies the genetic basis of key agronomic traits" Nature Genetics 506 (2018): 796

[16] Lu, Kun, et al "Whole-genome resequencing reveals Brassica napus origin and genetic loci involved in its improvement" Nature communications 101 (2019): 1154

[17] Zhou, Z, Jiang, Y, Wang, Z et al Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean Nat Biotechnol 33, 408–414 (2015)

[18] Liang, Z, Duan, S, Sheng, J et al Whole-genome resequencing of 472 Vitis accessions for grapevine diversity and demographic history analyses Nat Commun 10, 1190 (2019)

[19] Alexander, DH, Lange, K Enhancements to the ADMIXTURE algorithm for individual ancestry estimation BMC Bioinformatics 12, 246 (2011)

[20] Francis, Roy M "pophelper: an R package and web app to analyse and visualize population structure" Molecular ecology resources 171 (2017): 27-32

[21] >

以上就是关于生物中NST和SND是什么全部的内容，包括:生物中NST和SND是什么、【读文献】多肽作为双向交流信号调控胚胎发育、图位克隆法的图位克隆的技术环节等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/sjk/10192797.html

生物中NST和SND是什么

发表评论

评论列表（0条）