研究地球物种数量,究竟意义何在?用海洋生物学家沃姆的话来说,“如果我们连本国的人口数量,甚至连数量级都一无所知,谈什么规划未来?"
生物多样性,也是一样。人类已经开始致力于保护濒临灭绝的物种,可是直到现在,我们连地球上的物种数量都知之甚少。
数清新物种?难!
在安第斯山脉山脚下有一种蝙蝠,长得跟山莓一样大;在新加坡,有一种蠕虫,只寄居在变色蜥蜴的肺里。
这种蝙蝠和蠕虫有一个共同点:它们都是最新发现的物种。它们最近得到了正式的学名:蝙蝠叫Myotis diminutus,蠕虫叫Rhabdias singaporensis。
在这两种生物之后,科学家们当然还会继续发现新的生物物种,并将它们加入到数据库。研究者们每年会发现15万个新的生物物种,并且这一发现速度没有减缓的迹象。“随便问博物馆的任何一个分类学家,他们会告诉你他们有几百个物种等着要描述和分类。”夏威夷大学的海洋生态学家莫拉(Camilo Mora)说。
科学家们已经命名并且分类了130万个物种,但究竟还有多少物种没被发现呢?200多年来,这个问题就像头顶的乌云一样一直困扰着分类学家们。
加拿大达尔豪斯(Dalhousie)大学的海洋生物学家沃姆(Boris Worm)说:“我们连关于生命的这个最基本的问题都不知道,这是很让人震惊的事情。”
物种数量最新预测,870万
最近,莫拉、沃姆两位博士及其同事在《PloS Biology》期刊发表了一篇关于地球物种数量预测的文章。根据他们采用的最新分析方法,这个星球总共拥有870万个物种,误差浮动为130万。
新研究预测动物种类数将达到777万种,而目前已经描述和分类的动物有953434种,包括藻类、原生动物、植物、真菌在内,更多的物种还有待人类去发现和分类。来自sciencedaily
新方法覆盖到了地球上真核生物的五大王国,其中包括777万种动物,298万种植物,611万种真菌,364万种原生动物,275万种藻类。
研究还表明,陆地上约有86%,海洋中约有91%的物种还没有被人们发现和分类。
海洋中奇怪的生物
这项成果一经发表后,激起了其他专家的强烈反应。德国汉堡大学的海洋生物学家勃兰特(Angela Brandt)认可这是一项非常重要的成果。但是也有批评认为文章中的方法没办法得到验证,地球上生物的多样性应该比文中描述的大得多。
物种数量,发现不止,争论不休
1758年,瑞典科学家林奈(Carl Linnaeus)发明并且发表的物种分类和命名的方法一直沿用至今。从那以后的253年间,约有125万物种,包括约100万陆地物种和25万海洋物种,已经被描述和命名,成为生物物种核心数据库中的一员。此外,人们也描述出了约70万物种,但尚未被正式加入这个核心数据库。
1833年,英国的昆虫学家韦斯特伍德(John Obadiah Westwood)做过最早的全球生物多样性预测:全球到底有多少种昆虫。他先是估计了英国每一个植物物种上能有多少种昆虫,进而把这个数字扩展到全球。当时他估计,“40万这个数据可能不会离事实相差太远。”
现在,科学家们知道,韦斯特伍德的数字还是太小了。
人们现在已经发现超过100万个昆虫物种,而且新昆虫物种的发现速度丝毫没有减慢的趋势。来自guardiancouk
最近几十年,科学家们致力于找到更好的办法来查明到底还有多少个物种没有被发现。1988年,牛津大学的进化生物学家罗伯特(Robert May)发现,陆地上的生物体型越小,生物多样性就越大。他推测,我们已经发现了大多数体型较大的动物,比如哺乳动物,鸟类,在根据这些生物的多样性推测出小个体动物的多样性后,罗伯特最后预测大概有1000万到5000万种陆地动物。
其他科学家的预测小至300万,多至1亿。莫拉和他的同事认为,所有这些预测方法多少总有缺陷,最重要的是,这些方法没法通过验证来确定可信度。
新预测模型,到底准不准?
在最新预测中,科学家们的预测方法是根据分类学家的分类方法发展而来。每一个物种都可以归为一个组类“属”,而属又可以归为一个更大的组类“科”,并依此继续类推。比如我们人类,就是同其他5500个物种一起,被归为哺乳动物纲。
2002年,罗马大学的科学家发表了一篇文章,文章中他们用分类学上的大组类来预测意大利的植物多样性。在三个不同地点,他们记录了生物的属和科等等,在每一个地点,生物所在的组类就像金字塔层级一样,越高级,数量就越少。科学家们可以据此猜测每个地点的物种到底有多少,就好像可以通过金字塔的上层来猜测底层到底有多大。
这篇文章在当时几乎没有引起什么注意,但是莫拉和他的同事抓住了这一点,并且希望通过这个方法来预测地球上究竟有多少个物种。他们总结了自1750年以来新发现的动物,动物总数在最初的150年里急剧增长,然后接近顶峰,这表明我们已经几乎发现了所有动物。此外,他们还发现其他高等组类生物的发现速度也减缓了。科学家们构建了一个分类金字塔来预测我们已知的组类生物物种总数,比如哺乳动物和鸟类,而预测结果与已知数目接近。
1-6依次为门、纲、目、科、属、种的物种组类,基于金字塔的模型,科学家在现已发现和分类的953434个动物物种基础上,推测出地球上约有770万种动物。来自terceraculturacl
基于这种方法,科学家们预测了其他物种组类的数量,得到约有770万种动物和298万种植物的结论。尽管陆地只占地球表面29%的面积,但是科学家们推测这是地球上86%的生物的生存之所。
罗伯特认为,“地球上到底有多少种生物,是一个很重要的问题,而新方法提供了一种有趣而富有想象力的解决思路。”
但史密斯(Smithsonian)协会的昆虫学家欧文(Terry Erwin)认为这项研究存在重大缺陷。人们没有理由认为那些未经仔细研究的生物组类,会和那些被人类充分研究的生物组类遵循一样的规律。他表示,“他们测量出的是人类活动可及范围,而非真正的生物多样性。”
美国科罗拉多大学的进化生物学家波洛克(David Pollock)也同意这一说法。波洛克研究的是真菌界,是一个为人所知不多的生物组类。根据波洛克的说法,新方法的预测非常有限。已知分类的真菌有43271种,根据莫拉和他同事的方法,地球上约有66万种真菌,但是其他真菌多样性的研究表明这个数字可能高达510万。
这项新研究的作者也承认他们的这个方法并不适用于细菌。科学家们刚刚开始进入细菌多样性研究的领域,因此他们正在致力于把细菌归为各种大组类。莫拉及其同事认为,他们给出的“1万种”这个预测数字,也的确只是一个“最低值”。
在另一方面,微生物学家们非常确信微生物的多样性要比动物的多样性大得多。一勺泥土可能就包含1万种不同的细菌,其中很多都是新物种。
加利福尼亚大学的微生物多样性领域专家埃尔森(Jonathan Eisen)表达了对新研究成果失望的态度,他认为,“这就好比说‘恐龙是在多于500年以前统治过地球的’,这个说法的确没错,可是又有什么用呢?”
内容源自:关注微信公众号(东篱阳光),这里有最Top的装修设计师,最专业的团队,海量装修技巧、干货,手把手教你打造一个会呼吸的房子。
本文编译自《How Many Species A Study Says 87 Million, but It’s Tricky》、《How Many Species On Earth About 87 Million, New Estimate Says》
类似于语义网络。是为了生物界有一个统一的数据交流语言。 因为在生物学界,存在在种种同名异义、异议同名的现象。为此产生了GO项目。
GO是用一套统一的词汇表来描述生物学中的分子功能、生物过程和细胞成分。其思想大概过程:对于一个基因产品(蛋白质或RNA),用某些词汇来描述它是干什么的或位于细胞哪里、或者参与了哪个生物过程,而这些词汇就是来自GO的Term。
(1)提供生物学功能(术语)的逻辑结构及其相互之间的关系,表现为有向无环图
(2)给特定的基因产物(蛋白质,非编码RNA或大分子复合体,简称为'基因')起一个特定的名字(唯一标识该基因)
Gene Ontology(GO)中最基本的概念是term。GO里面的每一个entry都有一个唯一的数字标记,形如GO:nnnnnnn,还有一个term名,比如"cell", "fibroblast growth factor receptor binding",或者"signal transduction"。每个term都属于一个ontology,总共有三个ontology,它们分别是
细胞成分:细胞的部分或其细胞外环境;
分子功能:基因产物在分子水平上的元素活性,例如结合或催化;
生物过程:具有确定开始和结束的分子事件的 *** 作或集合,与综合生活单元的功能有关
理由一:
在基因表达谱分析中,GO常用于提供基因功能分类标签和基因功能研究的背景知识。利用GO的知识体系和结构特点,旨在发掘与基因差异表达现象关联的单个特征基因功能类或多个特征功能类的组合。
根据GO的知识体系,使用“功能类”(或者叫做“功能模块”)这一概念具有以下优点:我们认为,单个基因的表达情况的改变不足以反映特定功能/通路的整体变化情况。因为类似人类社会的组织结构,生物体的功能的实现决不仅仅是依靠一两个基因功能的改变来实现的。因此过分着重单个基因表达变化,将会在后期结果处理中严重干扰对于结果的合理分析,导致偏倚性加大,而且是无法避免的。因此利用GO的结构体系,把参与同样功能/通路的基因进行“功能类”层面的抽象和整合,提供比基因更高一层次的抽象结论,对理解疾病的发病机制或药物的作用机理等更有帮助。
但是该方法也存在一定的不足,由于生物体内部的调控网络可能具有“scale-free network”的特点,个别功能重要的基因(主效基因)具有“Hub节点”的重要特性,它的功能改变可能对于整个网络来说是至关重要的,在这点上,这些重要的基因又具有一定的“自私独裁”特点。而“功能类”之观点模糊了这种差别特性,过于强调“共性”,而忽视了“个性”,这也是“功能类”的一个不足之处,这就需要结合相关的生物学知识才能够实现
理由二:
GO(gene ontology)对大家而言也许会是一个相对陌生的名词,但是它已经成为生物信息领域中一个极为重要的方法和工具,并正在逐步改变着我们对 biological data的组织和理解方式,它的存在已经大大加快了我们对所拥有的生物数据的整合和利用,我们应该逐步学会理解和掌握这种思想和工具。
众所周知,sequence based biology中的核心内容即是对序列的Annotation(注释),其中主要包含structural annotation和functional annotation,前者涉及分析sequence在genome中的locus以及exon,intron,promoter等的location,而后者则是推断序列编码产物的功能
随着多种生物genome的相继解码,同时大量ESTs以及gene expression profile date的积累,使得annotation的工作量和复杂度大大增加。然而另一方面,大多数基因在不同真核生物中拥有共同的主要生物功能,通过在某些物种中获得的基因或者蛋白质(shared protein)的生物学信息,可以用以解释其他物种中对应的基因或蛋白(especially in comparative genomics)。由于这些繁复的功能信息主要是包含在积累的文献之中,如何有效的提取和综合这些信息就是我们面临的核心困难,这也是GO所要着力解决的问题。通过建立一套具有动态形式的控制字集(controlled vocabulary),来解释真核基因及蛋白在细胞内所扮演的角色,并随着生命科学研究的进步,不断积累和更新。一个ontology会被一个控制字集来描述并给予一定的名称,通过制定“本体”ontologies并运用统计学方法及自然语言处理技术,可以实现知识管理的专家系统控制
总结:
Gene Ontology(GO)包含了基因参与的生物过程,所处的细胞位置,发挥的分子功能三方面功能信息,并将概念粗细不同的功能概念组织成DAG(有向无环图)的结构。
Gene Ontology是一个使用有控制的词汇表和严格定义的概念关系,以有向无环图的形式统一表示各物种的基因功能分类体系,从而较全面地概括了基因的功能信息,纠正了传统功能分类体系中常见的维度混淆问题。
在基因表达谱分析中,GO常用于提供基因功能分类标签和基因功能研究的背景知识。利用GO的知识体系和结构特点,旨在发掘与基因差异表达现象关联的单个特征基因功能类或多个特征功能类的组合。
原文: >
一般来说所用的分析工具有在线跟下载的 下面简要列举一些常用在线软件的使用 1、使用VecScreen工具,分析下列未知序列,输出序列长度、载体序列的区域、可能使用的克隆载体都有哪些。一、步骤:
打开google 首页,搜索VecScreen,进入VecScreen首页,复制序列,运行,View report。
二、结果:
输出序列长度918bp,
载体序列的区域456bp——854bp
克隆载体:M13mp18 phage,pGEM-13Zf(+),pBR322,pRKW2。
2、使用相应工具,分析下列未知序列的重复序列情况,输出重复序列的区域、包含的所有重复序列的类型、重复序列的总长度及Masked Sequence。
一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的。
进入google首页,搜索RepeatMasker,进入RepeatMasker主页,进入RepeatMasking,复制序列,DNA source选择human,运行!点击超链接,在结果中选择
Annotation File :RM2sequpload_1287631711outhtml
3、使用CpGPlot/CpGReport/Isochore工具,分析下列未知序列,输出CpG岛的长度、区域、GC数量、所占的百分比及Obs/Exp值。一、步骤:
进入google首页,搜索CpGPlot,进入CpGPlot主页,program中选择cpgreport复制序列,运行!
二、结果:
CpG岛的长度:385bp
区域:48——432;
GC数量:Sum C+G=297,百分数=7714
Obs/Exp:101
4、预测下面序列的启动子,输出可能的启动子序列及相应的位置。一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的
进入google首页,搜索Neural Network Promoter Prediction,进入主页,复制序列,选择eukaryote,运行!
二、结果:
位置:711—761 ,1388—1438,1755—1805;
5、运用Splice Site Prediction工具分析下面序列,分别输出内含子-外显子剪接位点给体和受体的区域及剪接处位置的碱基。一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是human的
进入google首页,搜索Splice Site Prediction,进入主页,复制序列。Organism选择Human or other。其他默认,运行!
二、结果:
供体:
受体:
6、对下面序列进行六框翻译,利用GENESCAN综合分析(首先确定给定序列的物种来源)哪个ORF是正确的,输出六框翻译(抓图)和GENESCAN结果(包括predicted genes/exons 和 predicted peptide sequence(s) 两个部分)。一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST。得出序列是Zea的
进入google首页;搜索NCBI,进入主页,选择all resources(A~Z),选择O,选择ORF finder。复制序列,默认,运行!
二、结果:ORF图
三、步骤:进入google首页,搜索GENESCAN,进入主页,Organism:Maize, ,其他默认,运行!
四、结果:
G7、进入REBASE限制性内切酶数据库,输出AluI、MboI、EcoI三种内酶的Recognition Sequence和Type。
一、步骤:进入google首页,google in English,搜索REBASE,进入主页, 分别输入AluI、MboI、EcoI,运行!
在MboI中选择第一个,EcoI选择第二个。
二、结果:
ENSCAN图
8、使用引物设计工具,针对下列未知序列设计一对引物,要求引物长度为20-25bp,扩增产物长度300-500bp,退火温度为50-60℃。请写出选择的一对引物(Forward Primer and Reverse Primer)、及相应的GC含量、引物的位点、Tm值和产物长度。一、步骤:进入google首页,搜索genefisher,进入主页,复制fasta格式,chechk input, sunmit, ; ;设置一下引物长度为20-25bp,扩增产物长度300-500bp,退火温度为50-60℃; 。
二、结果:
GC含量:
引物的位点:
Tm值:
产物长度:。
9、将下面的序列用NEBcutter 20工具分析,用产生平末端及有四个酶切位点的酶进行酶切,并用抓图提交胶图(view gel),要求14% agarose和Marker为100bp DNA Ladder。
一、步骤:
进入google首页,进入ICBI主页,对序列进行BLAST,得知是linear。
进入google首页,搜索NEBcutter 20,进入主页,选择linear,运行!选择custom digest, ,把“1”改为“4”,选择平末端,后digest。View gel。选择14% agarose和Marker为100bp。
二、结果:
然后就是蛋白质的了一般都在expasy里swiss-prot 适用于检索的 compute pi/mw 求理论分子量 分子量 protparam物理化学性质 protscale亲水性疏水性 peptidemass分析蛋白酶和化学试剂处理后的内切产物
NCBI((>
外来入侵物种基本信息库。外来物数据库内容包括外来入侵物种基本信息库、调查信息库、物种库、专家信息库、参考文献库、多媒体库等6个子库。中国外来入侵物种数据库系统是我国进行生物入侵交流的权威网络信息平台。该系统由中国外来入侵物种数据库系统、中国外来入侵物种地理分布信息。
以上就是关于地球上到底有多少物种全部的内容,包括:地球上到底有多少物种、GO数据库介绍(转载)、列举常用的生物信息学数据库及序列对比常用软件及特点等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)