Treesei是工业上纤维素酶和半纤维素酶的主要生产来源,这些酶用于将生物质解聚成简单的糖类,再转化成化学中间体和生物燃料例如乙醇。对Treesei的基因组进行测序(Martinez et al,2008),将reads组装成89个scaffold,大小为34Mbp,包含9219个基因。出乎意料的是,相比其他已测序的能降解植物细胞壁多糖的真菌,Treesei基因组中编码的纤维素酶和半纤维素酶基因数目较少。许多Treesei的碳水化合物活性酶编码基因并非随机分布,而是成簇地分布在与其他粪壳菌纲(Sardariomycetes)真菌的共线性区域之间。
7211 Treesei基因组的特点
利用鸟q法对Treesei的基因组进行测序,构建了3个文库,插入片段的大小分别为3kb,8kb和40kb,覆盖度为9倍,共得到 433863个 reads,利用 Jazz,Phred/Phrap/Consed等软件将这些数据组装成89个scaffold和97个contig,大小约为34Mb(Martinez et al,2008)。比几个核型分析预测的基因组大小约大29%(Carter et al,1992;Man-tyla et al,1992;Herrera-Estrella et al,1993),与物理方法预测的大小几乎一致。核型分析所用的遗传标记和在Genbank中发布的所有蛋白和RNA序列在该基因组中都能找到。因此,推测该基因组序列代表了Treesei 99%以上的基因组信息。
在基因组中发现了类似于I和II型转座子的重复序列,但都存在多个终止密码子。造成缺少活跃转座子的原因可能是由于Treesei存在活跃的防御机制,例如重复诱导的点突变。这些转座子总数不超过基因组序列的1%,是目前已知的出现频率最低的真菌之一。在Treesei的7个scaffold末端存在重复6核苷酸序列TTAGGG,该序列与粉红面包霉(Neurospora crassa)端粒重复序列相同。
预测Treesei 基因组含有9129个基因,与Ncrassa中的基因数目相当(Galagan et al,2003),但是比禾谷镰刀菌(Fusarium graminearum,其有性态为Gibberella zeae)预测的基因数少了接近2500个(Cuomo et al,2007)。Treesei基因的平均大小为1793 bp,每个基因平均含有31个外显子,外显子的平均长度508 bp,内含子平均大小120 bp。
7212 Treesei保守共线性
为了解环境因素对基因组进化的影响,比较了Treesei,Fgraminearum和Ncrassa共线性的区域。根据比较结果,推测许多基因组片段中基因的顺序在该种类出现时就已经改变,共线性的区段间存在很大的间隙(Galagan et al,2005)。在很多情况下,Treesei和其他粪壳菌纲(Sordariomycetes)真菌中这种间隙是很保守的。非共线性的区域通常包含对菌株适应性重要的基因(Galagan et al,2005;Machida et al,2005;Nierman et al,2005)。另外一个值得注意的特点是在3个真菌(Treesei,Fgraminearum和Ncrassa)中存在一些随种类出现就已发生的染色体重排,表明了基因组的高度动态性。
7213 Treesei的蛋白结构域
与盘菌亚门(Pezizomycotina)的其他真菌相比,Treesei基因组中已知功能的蛋白质数量较少,与生物质降解有关的蛋白组成也不一样。Treesei缺少与侵染和降解植物活体组织相关的蛋白,例如果胶裂解酶和果胶酯酶,这与其腐生习性相符。而且,在Treesei中没有发现鞣酸酶和阿魏酸酯酶,表明其在半纤维素降解方面存在缺陷。
7214 Treesei和其他真菌中的碳水化合物活性酶
在CAZy数据库中,碳水化合物活性酶(Carbohydrate-active enzymes,CAZymes)被分为不同的级别和种类。能切割、构建和重排寡糖和多糖的CAZymes在真菌生物学中扮演重要的角色,对优化生物质的降解也同样重要。尽管Treesei是植物多糖的有效降解者和降解研究体系中的重要模式菌,但是在其基因组中含有的糖苷水解酶(GH)编码基因较少。Treesei中仅含有200个GH编码基因,比植物病原菌Magnaporthe grisea(231个)和Fgraminearum(243个)都少。
Treesei中含有103个糖基转移酶,接近粪壳菌纲(Sordariomycetes)中该类酶的平均数(96个)。在粪壳菌纲中,该酶类的变异性比GH小。这种趋势在世系内外皆存在,表明糖基转移酶控制的是比较基础性的胞内生命活动,其组成变化所反映的是物种的差异而非环境压力的不同。与植物多糖解聚过程有关的酶,通常携带一个碳水化合物结合组件(Carbohydrate-Binding Module,CBM),该组件连接在催化区上。在已知的粪壳菌纲中,Treesei的基因组中含CBM的蛋白数量最少。同样,Treesei中碳水化合物酯酶的数量也是粪壳菌纲中最少的。包括Treesei在内,粪壳菌纲真菌中相对缺少多糖裂解酶基因,而散囊菌纲真菌(Eurotiomycetes)含有的多糖裂解酶数量较多,平均有18个。在单细胞子囊菌纲(Ascomycetes)中没有发现多糖裂解酶。
出人意料的是,在Treesei基因组中仅发现了7个编码已知纤维素酶(内切葡聚糖酶和纤维二糖水解酶)的基因,在表74列出的能降解植物细胞壁的真菌中,Treesei的纤维素酶基因的数量最少。如果加上GH61蛋白家族,这种趋势更加明显。半纤维素包含不同种类的多糖,完全降解它们需要一系列的酶。Treesei基因组仅含有16个半纤维素酶基因,也是在真菌中数量较少的。同样,其分解果胶的酶数量为5个,也是在植物细胞壁降解真菌中数量较少的(Martinez et al,2008)。
表74 真菌基因组中的纤维素水解酶
注:a纤维素种类:CBH1,外切纤维二糖水解酶Ⅰ,GH7;CBH2,外切纤维二糖水解酶Ⅱ,GH6;EG1,内切葡聚糖酶Ⅰ,GH7;EG2,内切葡聚糖酶Ⅱ,GH5_5;EG3,内切葡聚糖酶Ⅲ,GH12_1;EG4,糖苷水解酶家族,Cel61,GH61;EG5,内切葡聚糖酶基因Ⅴ,Cel45。
7215 蛋白分泌
Treesei能非常有效地分泌胞外酶,有些工业菌株1L培养液可以产生100g胞外蛋白(Cherry et al,2003)。在Treesei中发现了与酿酒酵母(Saccharomyces cerevisiae)分泌途径中起作用蛋白的同源蛋白。这些蛋白多数是单拷贝,与酵母蛋白的相似性比与哺乳动物源相似蛋白的相似性更高。Treesei含有三个与酵母的蛋白质二硫键异构酶(Pdi lp)同源的蛋白,这可能与Treesei分泌的纤维素酶多数含有二硫键有关(Divne et al,1994)。酵母der1和ufd1基因在Treesei中都存在两个直系同源基因,它们与内质网相关的蛋白降解(ERAD)途径有关。此外,在Treesei中发现了大多数已知ERAD组分的同源蛋白,但在Aspergillus niger基因组中却缺少ERAD组分同源蛋白(Pel et al,2007)。这些数据表明,在Treesei中,ERAD途径似乎比内质网分泌途径更过剩。
Scerevisiae中参与蛋白运转相关的蛋白直系同源物大多数能在Treesei中找到,它们多数是单拷贝。酵母缺少与哺乳动物GTPase蛋白Rab2,Rab4,Rab5,Arf6和Arf10对应的蛋白,这些信号蛋白参与膜融合或囊泡的出芽,而在Treesei和Ncrassa中含有这些蛋白的直系同源物。酵母中质膜分泌小泡受体t-SNARE蛋白Sso1p,在Treesei中有两个同源蛋白,研究表明,这两个Sso1同源蛋白具有不同的功能(Valkonen et al,2007)。综上所述,这些研究表明Treesei的膜运输系统比在Scerevisiae中的更加多样化。
7216 Treesei的CAZyme基因簇
Treesei中许多CAZyme的编码基因在基因组中不是随机分布的。有研究表明,9个与纤维素和半纤维素降解有关的蛋白编码基因共同分布在基因组的几个区域。通过对Treesei基因组中所有CAZyme的编码基因定位发现,316个CAZyme中的130(41%)分布在25个不连续的区域,这些区域大小从14 kb到275 kb不等(总共约24Mb,约占基因组的7%)。这些区域中含有CAZyme基因的密度比随机分布基因密度大5倍。
通过对基因簇中基因数量的分析,130个CAZyme的95个(73%)分布在基因组共线性区域的间隙。而这95个中的69个(72%)在Fgraminearum含有直系同源物。有16个CAZyme与Fgraminearum共线性,表明基因迁移是这些基因簇形成的主要因素,而基因复制的作用较小。在同一基因簇中的CAZyme基因很少是出自同一个CAZyme家族,这也表明基因的迁移在这些基因簇形成过程的作用比基因复制更大。
CAZyme基因成簇分布表明其特殊的生物学功能,在基因簇中的CAZyme基因有70%编码GH。基因组中有24%的糖基转移酶基因和46%的GH基因分布在这些基因簇内,表明这些基因簇中的CAZyme基因大多数参与多糖的降解。与植物细胞壁降解有关的基因多数分布在富含CAZyme的区域的现象,也证实了这一点。Treesei中有4个类似于扩展蛋白的基因(Saloheimo et al,2002),其中3个分布在这些基因簇内。有趣的是,少量与真菌细胞壁合成有关的糖基转移酶编码基因也出现在CAZyme基因簇中,比如甘露糖基转移酶、几丁质合酶、a-糖基转移酶和β-糖基转移酶(Cabib et al,2001)。
结合对槐二糖和纤维素诱导的Treesei转录组数据进行分析(Foreman et al,2003),将槐二糖和纤维素诱导表达基因定位到基因组上,发现尽管不是所有成簇分布的GH基因都共表达,但是确实发现了一些相邻基因共表达的例子。例如,在Treesei基因组第29条scaffold的CAZyme基因簇区,外切纤维二糖水解酶cel7a、纤维素膨胀因子和木聚糖酶4在槐二糖和纤维素诱导下同时表达。上述结果表明,CAZyme基因成簇分布具有重要的意义。由于这些区域与其他真菌没有共线性的信号,表明在Treesei中这些基因发生了重排,这种重排对其在进化上是有利的。
在几个CAZyme基因密度高的区域也包含与次级代谢有关的蛋白编码基因。在25个CAZyme基因簇中,有5个基因簇都包含一个聚酮合酶(PKS)或非核糖体肽合成酶(NRPS)基因。另外,与其他Sordariomycetes真菌相比,Treesei中保留了大多数非核糖体肽合成酶(NRPS)的旁系同源基因。
人体内外住着许多微生物,肠道、皮肤、生殖器官、口腔等部位有不少微生物与人共生,可谓小小生态系。这些迷你生物们种类繁多,多半无法人为培养,从前难以研究。
受惠于科技进步,如今可以直接定序样本中所有 DNA,拼凑不同生物的基因组。因此即使是无法培养、甚至是前所未知的微生物,都有机会被新的办法找到。
同样概念也能用于古时候的样本,了解古代的共生微生物。最近有 2 篇论文发表,分别探讨和古代人类共生的口腔与肠道菌。
尼安德塔人会吃草吗?取自 Mauricio Anton 从牙结石获得古代口腔微生物
研究古人口腔中的微生物,比研究皮肤、肠道等其他部位容易。这是因为软组织很难保存,即使有软组织,除了冰人奥兹等罕见案例之外,里头的微生物也很难留下踪影;相较之下,口腔中的各种成分却常常会进入牙结石,和牙齿一同遗留至今。
过往曾有一些古代智人牙结石的研究问世,而距今数万年之久的尼安德塔人,也有过几件样本发表。
这次的 两篇新论文,除了 15 个已知样本之外,又获得 109 个新的牙结石;这总共 124 件的样本,分别来自美洲的吼猴,非洲的大猩猩、黑猩猩,数万年前的尼安德塔人和智人,以及更近期的智人。[1, 2]
贡献牙结石样本的古代、现代智人们。取自 [参考资料 1]
各种灵长类动物之间,有些共通的微生物款式,由此可以推论,某些微生物,与灵长类应该有着长期的共生关系,也许超过千万年。口腔中的微生物,主要有链球菌属(Streptococcus)、放线菌属(Actinomyces)、细梭菌属(Fusobacterium)、棒状杆菌属(Corynebacterium)几大类。
研究微生物常常碰到的困难是,近亲彼此间变化太多,也有很多不知道的款式。这回由人类牙结石取得的口腔微生物们,根据遗传差异总共可以归类为 27 个属(genus)的层级,可是其中 3 群竟然连名字都没有。
也就是说,尽管它们曾经是人类口中主要的微生物,整个属却都没有已知的资讯。对于共生微生物,还有太多未知之处。
贡献牙结石样本的尼安德塔人们。取自 [参考资料 1] 欧洲智人与尼安德塔人,口腔共享微生物?
这回获得年代最早的样本,是距今约 10 万年的尼安德塔人,来自东欧的塞尔维亚 Pešturina 遗址,其余数万年前的尼安德塔人,则位于西班牙、比利时、义大利。
有趣的是,早于 14 万年前的欧洲智人,和更早的尼安德塔人有类似的口腔微生物组成;晚于 14 万年的欧洲智人却明显不同,接近后来的智人。已经知道距今 14 万年过后有不少移民进入欧洲。看来状况是:不同人群,也携带不同的口腔微生物。
欧洲较早智人的口腔微生物,和尼安德塔人有直接关系吗?口腔微生物的形成和宝宝的照顾者有关,研究者因此推论,当初进入欧洲见到尼安德塔人的智人,双方有过小孩,也获得了尼安德塔人的口腔微生物。[3]
超过 4 万年的欧洲智人(以 Zlatý Kůň 为代表)和后来欧洲、亚洲人的遗传关系。非洲以外的智人尚未分家以前,已经与尼安德塔人发生遗传交流;但是欧洲较晚的智人,遗传上和较早的智人移民没有直接关系。取自 A bumpy ride to the re-discovery of Zlatý Kůň
问题是,上述推论不符合已知证据。智人继承的尼安德塔人 DNA 皆来自超过 5 万年前,非洲外族群尚未分家以前的阶段。超过 4 万年前进入欧洲的智人,确实见过尼安德塔人,有些人还有过更多遗传交流;但是他们后来都灭团了,和更晚的欧洲智人没有直接关系。[4, 5]
与尼安德塔人拥有类似口腔微生物,距今 14 到 3 万多年前的欧洲智人,非常可能是在尼安德塔人消失以后才进入欧洲,其实没有见面的机会。双方的口腔微生物之所以相似,我想并非来自直接交流,而是另有原因。
即使没有农业,智人与尼安德塔人都吃很多淀粉?
另一项值得一提的发现是,尼安德塔人与智人的口腔,都存在不少会消化淀粉的链球菌型号。如果饮食中没什么淀粉,这类微生物不太可能这么丰富;由此推论,尚未发明农业的智人,甚至是尼安德塔人,或许平时都摄取不少淀粉。
古今的智人饮食可谓千变万化,即使没有米、麦、玉米等农作物,不依赖农业,光凭采集块根、块茎、果果等食物,也能获得大量淀粉。
美国的犹他,富含淀粉的野生马铃薯 Solanum jamesii。考古研究发现,尚未出现农业的一万年前,当地人已经会食用这种植物。取自 Starch granule evidence for the earliest potato use in North America
至于尼安德塔人吃什么,目前了解仍很有限。有些研究认为尼安德塔人主要吃肉,尤其是大型植食动物的肉。这回提出的大量淀粉,仍是需要验证的论点。
我个人的想法是,即使没有农业,仰赖所谓的采集、狩猎、渔业,不同时空的智人饮食也差异很大,尼安德塔人或许也是如此。有些吃肉当主食,有些大量摄取淀粉,搞不好更接近实际状况。至今取样非常有限下,难以评估尼安德塔人的饮食多元性。
一千多年前美洲古人的肠道菌
住在肠道的微生物们会影响消化、免疫等功能,近年来知名度大增,可能连榕树下的阿伯都知道。
近日发表的另一项研究,获得了距今 1000 到 2000 年前,几位美洲古人的肠道菌。取样肠道菌通常不会深入肠道,而是由粪便采样。新研究也是如此,稀有的样本来自美国西南部 3 处遗址的粪便化石。[6, 7, 8, 9, 10]
研究者尝试 15 个样本,成功 8 个,定序当中所有 DNA 后,总共拼凑出 498 种细菌的基因组。这儿想要探索的对象是「古代」「肠道菌」,排除疑似非古代的样本后剩下 209 个,其中只有 181 种源自肠道,最有机会真的是古代人的肠道菌。
取自 PHIL MARDEN
微生物数量多、突变多,品系差异千变万化,大部分不在人类的认知内;这类研究方法又是靠拼凑 DNA 推测,没有获得完整的真正细菌。因此这儿的「种」和一般讲的物种不太ㄧ样,指的是 species-level genome bin,简称 SGB。为求方便,本文直接写成种。
181 种古代肠道菌中有 39%,也就是 61 种之前没有见过。它们或许已经消失,或是古代美国西南部独特的款式。探索古代微生物时,发现未知的微生物算是常态。
呼应人类大历史的肠道共生关系
古代和 789 位现代人相比,大部分肠道菌种类还是共通的,不过遗传上有点出入。古代样本拼凑出 2 款 Methanobrevibacter ithii,中文姑且称之为「史密斯甲烷短杆菌」。甲烷短杆菌常常在肠道发现,它们不是细菌,是古生菌(archaea,也叫作太古生物)。
古代与现代的史密斯甲烷短杆菌,根据基因组差异建构的演化树。红色是来自古代美洲人的样本。取自 [参考资料 6]
超过一千年的 2 款史密斯甲烷短杆菌,遗传上彼此最相似,落在现代样本的 DNA 变异之内。估计所有这类古生菌共同祖先的年代,介于距今 51 到 128 万年之间,平均 85 万年前。似乎是智人祖先离开非洲时,装在肚子里,一起带着走的肠道菌之一。
有意思的是,美洲古代古生菌和最近同类分家的年代,介于距今 16 到 4 万年之间,平均 27 万年前。倘若估计正确,大概落在智人移民美洲,与亚洲渐渐分家的年代范围。
这些与人共生的微生物,也隐藏着迁徙移民史的线索。
尚未工业化,没有抗生素的年代
生活环境、日常饮食,都是影响肠道菌组成的主要原因。和 789 位现代人相比,古人的肠道菌较接近非工业化社会的人,和工业化社会的人差异很明显,符合预期。
在 PCA 之下的肠道菌组成,古代美洲人较类似非工业化社会的现代人,不像工业化社会的现代人。取自 [参考资料 7]
基因层次上,工业化社会现代人的肠道菌,有比较多分解聚糖(glycan)的基因(endo-4-O-sulfatase、SusD-like protein)。
相对地,古人和非工业化现代人的肠道菌,则有较多分解淀粉、肝糖(glycogen)的基因(carbohydrate-active enzyme,简称 CAZyme);另外它们的可动遗传因子也比较多(mobile geic element,例如转座子),也许在变动的环境下,有助于增加适应力。
但是不论工业化或非工业化社会的现代人,肠道菌配备对抗抗生素的基因,都明显比古人更多。让我们一瞥抗生素广泛使用后,对肠道菌的影响。
以上就是关于里氏木霉(T.reesei)的基因组全部的内容,包括:里氏木霉(T.reesei)的基因组、尼安德塔人与穿越时代的肠道菌!与古代人共生,是怎样的微生物、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)