人类基因组计划_工具

分类: 医疗健康

问题描述:

人类基因组计划现在进行的怎么样了自从宣布人类基因组草图绘制完成后,就很久没听到这方面的报道了

解析:

■人类基因组计划的研究现状与展望------发表日期：2004年3月30日

一、研究现状

1、人类基因组测序

1990年～1998年，人类基因组序列已完成和正在测序的共计约330Mb，占人基因组的11％左右；已识别出人类疾病相关的基因200个左右。此外，细菌、古细菌、支原体和酵母等17种生物的全基因组的测序已经完成。

值得一提的是，企业与研究部门的携手，将大大地促进测序工作的完成。美国的基因组研究所（The Institute of Genome Research, TIGR）与PE（Perkin-Elmar）公司合作建立新公司，三年内投资2亿美元，预计于2002年完成全序列的测定。这一进度将比美国资助的HGP的预定目标提前三年。美国加州的一家遗传学数据公司(Incyte)宣布（1998年〕，两年内测定基因组中的蛋白质编码序列以及密码子中的单核苷酸的多态性，最后将绘制一幅人的10万个基因的定位图。与Incyte公司合作的HGS（Human Genome Science）公司的负责人宣称，截止1998年8月，该公司已鉴定出10万多个基因（人体基因约为12万个），并且得到了95％以上基因的EST（expressed sequence tag）或其部分序列。

1998年9月14日美国国家人类基因组计划研究所（NHGRI）和美国能源部基因组研究计划的负责人在一次咨询会议上宣布，美国资助的人类基因组计划将于2001年完成大部分蛋白质编码区的测序，约占基因组的三分之一，测序的差错率不超过万分之一。同时还要完成一幅“工作草图”，至少覆盖基因组的90％，差错率为百分之一。2003年完成基因组测序，差错率为万分之一。这一时间表显示，计划将比开始的目标提前两年完成。

2、疾病基因的定位克隆

人类基因组计划的直接动因是要解决包括肿瘤在内的人类疾病的分子遗传学问题。6000多个单基因遗传病和多种大面积危害人类健康的多基因遗传病的致病基因及相关基因，代表了对人类基因中结构和功能完整性至关重要的组成部分。所以，疾病基因的克隆在HGP中占据着核心位置，也是计划实施以来成果最显著的部分。

在遗传和物理作图工作的带动下，疾病基因的定位、克隆和鉴定研究已形成了，从表位→蛋白质→基因的传统途径转向“反求遗传学”或“定位克隆法”的全新思路。随着人类基因图的构成，3000多个人类基因已被精确地定位于染色体的各个区域。今后，一旦某个疾病位点被定位，就可以从局部的基因图中遴选出相关基因进行分析。这种被称为“定位候选克隆”的策略，将大大提高发现疾病基因的效率。

3、多基因病的研究

目前，人类疾病的基因组学研究已进入到多基因疾病这一难点。由于多基因疾病不遵循孟德尔遗传规律，难以从一般的家系遗传连锁分析取得突破。这方面的研究需要在人群和遗传标记的选择、数学模型的建立、统计方法的改进等方面进行艰苦的努力。近来也有学者提出，用比较基因表达谱的方法来识别疾病状态下基因的激活或受抑。实际上，“癌肿基因组解剖学计划（Cancer Genome Anatomy Project,CGAP”就代表了在这方面的尝试。

4、中国的人类基因组研究

国际HGP 研究的飞速发展和日趋激烈的基因抢夺战已引起了中国和科学界的高度重视。在的资助和一批高水平的生命科学家带领下，我国已建成了一批实力较强的国家级生命科学重点实验室，组建了北京、上海人类基因组研究中心。有了研究人类基因组的条件和基础，并引进和建立了一批基因组研究中的新技术。中国的HGP在多民族基因保存、基因组多样性的比较研究方面取得了令人满意的成果，同时在白血病、食管癌、肝癌、鼻咽癌等易感基因研究方面亦取得了较大进展。

首先建立了寡核苷酸引物介导的人类高分辨染色体显微切割和显微基因克隆技术；已建立的17种染色体特异性DNA文库和24种染色体区特异性DNA文库及其探针；构建了人X染色体YAC图谱，已完成了人X染色体Xp112-p213跨度的约35cM STS－YAC图谱的构建；建立了YAC－cDNA筛选技术。

目前的研究工作还包括: 疾病和功能相关新基因的分离、测序和克隆的技术和方法学的创新研究；中国少数民族HLA分型研究及特种基因的分析；人胎脑cDNA文库的构建和新基因的克隆研究。

中国是世界上人口最多的国家，有56 个民族和极为丰富的病种资源，并且由于长期的社会封闭，在一些地区形成了极为难得的族群和遗传隔离群，一些多世代、多个体的大家系具有典型的遗传性状，这些都是克隆相关基因的宝贵材料。但是，由于我国的HGP 研究工作起步较晚、底子薄、资金投入不足，缺乏一支稳定的、高素质的青年生力军，我国的HGP 研究工作与国外近年来的惊人发展速度相比，差距还很大，并且有进一步加大的危险。如果我们在这场基因争夺战中不能坚守住自己的阵地，那么在21 世纪的竞争中我们又将处于被动地位：我们不能自由地应用基因诊断和基因治疗的权力，我们不能自由地进行生物药物的生产和开发，我们亦不能自由地推动其他基因相关产业的发展。

二、展望

1、生命科学工业的形成

由于基因组研究与制药、生物技术、农业、食品、化学、化妆品、环境、能源和计算机等工业部门密切相关，更重要的是基因组的研究可以转化为巨大的生产力，国际上一批大型制药公司和化学工业公司大规模纷纷投巨资进军基因组研究领域，形成了一个新的产业部门，即生命科学工业。

世界上一些大的制药集团纷纷投资建立基因组研究所。Ciba-Geigy 和Ssandoz合资组建了Novartis 公司，并斥资25亿美元建立研究所，开展基因组研究工作。Smith Kline 公司花125亿美元加快测序的进度，将药物开发项目的25％建立在基因组学之上。Glaxo-Welle 在基因组研究领域投入4，700万美元，将研究人员增加了一倍。

大型化学工业公司向生命科学工业转轨。孟山都公司早在1985年就开始转向生命科学工业。至1997年，该公司向生物技术和基因组研究的投入已高达66亿美元。1998年4月，杜邦公司宣布改组成三个实业单位，由生命科学领头。1998年5月，该公司又宣布放弃能源公司Conaco，将其改造成一家生命科学公司。Dow化学公司用9亿美元购入Eli Lilly公司40％的股票，从事谷物和食品研究，后又成立了生命科学公司。Hoechst公司则出售了它的基本化学品部门，转项投资生物技术和制药。

传统的农业和食品部门也出现了向生物技术和制药合并的趋势。Genzyme Transgenics 公司培养出的基因工程羊能以较高的产量生产抗凝血酶III，一群羊的酶产量相当于投资115亿美元工厂的产量。据估计，转基因动物生产的药物成本是大规模细胞培养法的十分之一。一些公司还在研究生产能抗骨质疏松的谷物，以及大规模生产和加工基因工程食品。

能源、采矿和环境工业也已在分子水平上向基因组研究汇合。例如，用产甲烷菌Methanobacterium 作为一种新能源。用抗辐射的细菌Deinococcus radiodurans清除放射性物质的污染，并在转入tod基因后，在高辐射环境下清除多种有害化学物质的污染。

2、功能基因组学

人类基因组计划当前的整体发展趋势是什么？一方面，在顺利实现遗传图和物理图的制作后，结构基因组学正在向完成染色体的完整核酸序列图的目标奋进。另一方面，功能基因组学已提上议事日程。人类基因组计划已开始进入由结构基因组学向功能基因组学过渡、转化的过程。在功能基因组学研究中，可能的核心问题有：基因组的表达及其调控、基因组的多样性、模式生物体基因组研究等。

（1）基因组的表达及其调控

1）基因转录表达谱及其调控的研究

一个细胞的基因转录表达水平能够精确而特异地反映其类型、发育阶段以及反应状态，是功能基因组学的主要内容之一。为了能够全面地评价全部基因的表达，需要建立全新的工具系统，其定量敏感性水平应达到小于1个拷贝/细胞，定性敏感性应能够区分剪接方式，还须达到检测单细胞的能力。近年来发展的DNA微阵列技术，如DNA芯片，已有可能达到这一目标。

研究基因转录表达不仅是为了获得全基因组表达的数据，以作为数学聚类分析。关键问题是要解析控制整个发育过程或反应通路的基因表达网络的机制。网络概念对于生理和病理条件下的基因表达调控都是十分重要的。一方面，大多数细胞中基因的产物都是与其它基因的产物互相作用的；另一方面，在发育过程中大多数的基因产物都是在多个时间和空间表达并发挥其功能，形成基因表达的多效性。在一个意义上，每个基因的表达模式只有放到它所在的调控网络的大背景下，才会有真正的意义。进行这方面的研究，有必要建立高通量的小鼠胚胎原位杂交技术。

2）蛋白质组学研究

蛋白质组学研究是要从整体水平上研究蛋白质的水平和修饰状态。目前正在发展标准化和自动化的二维蛋白质凝胶电泳的工作体系。首先用一个自动系统来提取人类细胞的蛋白质，继而用色谱仪进行部分分离，将每区段中的蛋白质裂解，再用质谱仪分析，并在蛋白质数据库中通过特征分析来认识产生的多肽。

蛋白质组研究的另一个重要内容是建立蛋白质相互关系的目录。生物大分子之间的相互作用构成了生命活动的基础。组装基因组各成分间的详尽作图已在T7噬菌体（55个基因）获得成功。如何在模式生物（如酵母）和人类基因组的研究中建立自动方法，认识不同的生化通路，是值得探讨的问题。

3）生物信息学的应用

目前，生物信息学已大量应用于基因的发现和预测。然而，利用生物信息学去发现基因的蛋白质产物的功能更为重要。模式生物体中越来越多的蛋白质构建编码单位被识别，无疑为基因和蛋白质同源关系的搜寻和家族的分类提供了极其宝贵的信息。同时，生物信息学的算法、程序也在不断改善，使得不仅能够从一级结构，也能从估计结构上发现同源关系。但是，利用计算机模拟所获得的理论数据，还需要经过实验经过的验证和修正。

（2）基因组多样性的研究

人类是一个具有多态性的群体。不同群体和个体在生物学性状以及在对疾病的易感性与抗性上的差别，反映了进化过程中基因组与内、外部环境相互作用的结果。开展人类基因组多样性的系统研究，无论对于了解人类的起源和进化，还是对于生物医学均会产生重大的影响。

1）对人类DNA的再测序

可以预测，在完成第一个人类基因组测序后，必然会出现对各人种、群体进行再测序和精细基因分型的热潮。这些资料与人类学、语言学的资料项结合，将有可能建立一个全人类的数据库资源，从而更好地了解人类的历史和自身特征。另外，基因组多样性的研究将成为疾病基因组学的主要内容之一，而群体遗传学将日益成为生物医药研究中的主流工具。需要对各种常见多因素疾病（如高血压、糖尿病和精神分裂症等）的相关基因及癌肿相关基因在基因组水平进行大规模的再测序，以识别其变异序列。

2）对其它生物的测序

对进化过程各个阶段的生物进行系统的比较DNA测序，将揭开生命35亿年的进化史。这样的研究不仅能勾画出一张详尽的系统进化树，而且将显示进化过程中最主要的变化所发生的时间及特点，比如新基因的出现和全基因组的复制。

认识不同生物中基因序列的保守性，将能够使我们有效地认识约束基因及其产物的功能性的因素。对序列差异性的研究则有助于认识产生大自然多样性的基础。在不同生物体之间建立序列变异与基因表达的时空差异之间的相关性，将有助于揭示基因的网络结构。

（3）开展对模式生物体的研究

1）比较基因组研究

在人类基因组的研究中，模式生物体的研究占有极其重要的地位。尽管模式生物体的基因组的结构相对简单，但是它们的核心细胞过程和生化通路在很大程度上是保守的。这项研究的意义是：1〕有助于发展和检验新的相关技术，如大规模测序、大规模表达谱检验、大规模功能筛选等；2〕通过比较和鉴定，能够了解基因组的进化，从而加速对人类基因组结构和功能的了解；3〕模式生物体间的比较研究，为阐明基因表达机制提供了重要的线索。

目前对于基因组总体结构组成方面的知识，主要来源于模式生物体的基因组序列分析。通过对不同物种间基因调控序列的计算机分析，已发现了一定比例的保守性核心调控序列。根据这些序列建立的表达模式数据库对破译基因调控网络提供了必要的条件。

2）功能缺失突变的研究

识别基因功能最有效的方法，可能是观察基因表达被阻断后在细胞和整体所产生的表型变化。在这方面，基因剔除方法（knock-out）是一项特别有用的工具。目前。国际上已开展了对酵母、线虫和果蝇的大规模功能基因组学研究，其中进展最快的是酵母。欧共体为此专门建立了一个称为EUROFAN(European Functional Analysis Neork)的研究网络。美国、加拿大和日本也启动了类似的计划。

随着线虫和果蝇基因组测序的完成，将来也可能开展对这两种生物的类似性研究。一些突变株系和技术体系建立后，不仅能够成为研究单基因功能的有效手段，而且为研究基因冗余性和基因间的相互作用等深层次问题奠定了基础。小鼠作为哺乳动物中的代表性模式生物，在功能基因组学的研究中展有特殊的地位。同源重组技术可以破坏小鼠的任何一个基因，这种方法的缺点是费用高。利用点突变、缺失突变和插入突变造成的随机突变是另一中可能的途径。对于人体细胞而言，建立反义寡核苷酸和核酶瞬间阻断基因表达的体系可能更加合适。蛋白质水平的剔除术也许是说明基因功能最有力的手段。利用组合化学方法有望生产出化学剔除试剂，用于激活或失活各种蛋白质。

总之，模式生物体的基因组计划为人类基因组的研究提供了大量的信息。今后，模式生物体的研究方向是将人类基因组8～10万个编码基因的大部分转化为已知生化功能的多成分核心机制。而要获得酶一种人类进化保守性核心机制的精细途径，以及它们的紊乱导致疾病的各种途径的知识，将只能来自对人类自身的研究。

通过功能基因组学的研究，人类最终将将能够了解哪些进化机制已经确实发生，并考虑进化过程还能够有哪些新的潜能。一种新的解答发育问题的方法可能是，将蛋白质功能域和调控顺序进行重新的组合，建立新的基因网络和形态发生通路。也就是说，未来的生物科学不仅能够认识生物体是如何构成和进化的，而且更为诱人的是产生构建新的生物体的可能潜力。

人类基因组研究的一个关键应用是通过位置克隆寻找未知生物化学功能的疾病基因。这个方法包括通过患病家族连锁分析来绘制包含这些基因的染色体区域图，然后检查该区域来寻找基因。位置克隆是很有用的，但是也是非常乏味的。当在1980s早期该方法第一次提出时，希望实现位置克隆的研究者们不得不产生遗传标记来跟踪遗传，进行染色体行走得到覆盖该区域的基因组DNA，通过直接测序或间接基因识别方法分析大约1Mb大小的区域。最早的两个障碍在1990s中期在人类基因组项目的支持下随着人类染色体的遗传和物理图谱的发展而清除。然而，剩余的障碍仍然是艰难的。

所有这些将随着人类基因组序列草图的实用性而改变。在公共数据库中的人类基因组序列使得候选基因的计算机快速识别成为可能，随之进行相关候选基因的突变检测，需要在基因结构信息的帮助。对于孟德尔遗传疾病，一个基因的搜索在一个适当大小的研究小组经常在几个月实现。至少30个疾病基因直接依赖公共提供的基因组序列已经定位克隆到。因为大多数人类序列只是在过去的12个月内得到，可能许多类似的发现还没有出版。另外，有许多案例中，基因组序列发挥着支持作用，例如提供候选微卫星标识用于很好的遗传连锁分析。（2001年中国上海和北京科学家发现遗传性乳光牙本质Ⅱ型基因）

基因组序列对于揭示导致许多普通的染色体删除综合症的机制同样有帮助。在几个实例中，再发生的删除被发现，由同源体重组合在大的几乎同一的染色体内复制的不等交叉产生。例子包括在第22条染色体上的DiGeorge/ velocardiofacial综合症区和在第7条染色体上的Williams-Beuren综合症的重复删除。

基因组序列的可用性同样允许疾病基因的旁系同源性的快速识别，对于两个理由是有价值的。首先，旁系同源基因的突变可以引起相关遗传疾病。通过基因组序列使用发现的一个很好的例子是色盲（完全色盲）。CNGA3基因，编码视锥体光感受器环GMP门控通道的a亚单位，显示在一些色盲家系中存在突变体。基因组序列的计算机检索揭示了旁系同源基因编码相应的b亚单位，CNGB3（在EST数据库中没有出现）。CNGB3基因被快速认定为是其他家系的色盲的原因。另一个例子是由早衰1和早衰2基因提供的，它们的突变可能导致Alzheimer疾病的的早期发生。第二个理由是旁系同源体可以提供治疗敢于的机会，例子是在镰刀状细胞疾病或β地中海贫血的个体中试图再次激活胚胎表达的血红蛋白基因，它是由于β-球蛋白基因突变引起的。

我们在在线人类孟德尔遗传数据库（OMIM）和SwissProt 或TrEMBL蛋白质数据库中进行了971个已知的人类疾病基因的旁系同源体的系统检索。我们识别了286个潜在的旁系同源体（要求是至少50个氨基酸的匹配，在相同的染色体上一致性大于70%但小于90%，在不同的染色体上小于95%）。尽管这种分析也许识别一些假基因，89%的匹配显示在新靶序列一个外显子以上的同源性，意味着许多是有功能的。这种分析显示了在计算机中快速识别疾病基因的潜能。在过去的世纪里，制药产业很大程度上依赖于有限的药物靶来开发新的治疗手段。最近的纲要列举了483个药物靶被看作是解决了市场上的所有药物。知道了人类的全部基因和蛋白质将极大的扩展合适药物靶的寻找。虽然，仅仅人类的小部分基因可以作为药物靶，可以预测这个数目将在几千之上，这个前景将导致基因组研究在药物研究和开发中的大规模开展。一些例子可以说明这一点：

⑴神经递质(5-HT）通过化学门控通道介导快速兴奋响应。以前识别的5-HT3A受体基因产生功能受体，但是比在活体内有小得多的电导。交叉杂交实验和EST分析在揭示已知受体的其他同源体上都失败了。然而，通过对人类基因组序列草图的低要求检索，一个推定的同源体被识别，在一个PAC克隆中第11号染色体长臂上。同源体显示在纹状体、尾状核、海马中表达，全长cDNA随后得到。这个编码胺受体地基因，被命名为5-HT3B。当与5-HT3A组合成异二聚体中，它显示负责大电导神经胺通道。假定胺途径在精神疾病和精神分裂症的中心作用，一个主要的新的治疗靶的发现是相当有兴趣的。

⑵半胱氨酰基白三烯的收缩和炎症作用，先前认为是过敏反应的慢反映物质（SRS-A），通过特定的受体介导。第二个类似的受体，CysLT2，使用老鼠EST和人类基因组序列的重组得到识别。这导致了与先前识别的唯一的其它受体有38%氨基酸一致性的基因的克隆。这个新的受体，显示高的亲和力和几个白三烯的结合，映射在与过敏性哮喘有关的第13号染色体区域上。这个基因在气道平滑肌和心脏中表达。作为白三烯途径中抗哮喘药物开发中一个重要的靶，新受体的发现有明显的重要的作用。

⑶ Alzheimer疾病在老年斑中有丰富的β-淀粉样物沉积。β-淀粉样物由前体蛋白（APP）蛋白水解生成。有一个酶是β位 APP裂开酶，是跨膜天冬氨酸蛋白酶。公共的人类基因组草图序列计算机搜索最近识别了BACE的一个新的同源序列，编码一个蛋白，命名为BACE2，它与BACE有52%的氨基酸序列一致性。包含两个激活蛋白酶位点和象APP一样，映射到第21条染色体的必须Down综合症区域。它提出了问题，BACE2和APP过多的拷贝是否有功于加速Down综合症病人的脑部β-淀粉样物沉积。

给出了这些例子，我们在基因组序列中进行系统的识别传统药靶蛋白质的旁系同源体。使用的靶列表在SwissPrott数据库中识别了603个入口，有唯一的访问码。一个例子是：解决了困扰研究者几十年的一个神秘课题：苦味的分子学基础。人类和其他动物对于某一种苦味有不同的响应（响应的多态性）。最近，研究者将这个特征映射到人类和老鼠中，然后检索了G蛋白偶合受体的人类基因组序列草图上的相关区域。这些研究很快导致了该类蛋白的新家族的发现，证明了它们几乎都在味蕾表达，实验证实了在培养细胞中的受体响应特定的苦基质。

人体基因组图谱是全人类的财产，这一研究成果理应为全人类所分享、造福全人类，这是参与人类基因组工程计划的各国科学家的共识。值得关注的是，目前在人类基因组研究领域，出现了一些私营公司争相为其成果申请专利的现象。美国塞莱拉基因公司曾表示，想把一部分研究成果申请专利，有偿提供给制药公司。

找到了一批主宰人体疾病的重要基因

如：肥胖基因、支气管哮喘基因。这类基因的新发现每年都有新报道。这些基因的发现，增进了人们对许多重要疾病机理的理解，并且推动整个医学思想更快的从重治疗转向重预防。例如：湖南医科大学夏家辉教授组于1998528发表克隆了人类神经性高频性耳聋的致病基因（GJB3），这是第一次在中国克隆的基因。

在人类基因组计划的推动下，涌现了几门崭新的学科。如：基因组学(genomics）和生物信息学(bioinformatics)

生物技术的产业化。一批世界级的大公司纷纷把它们的重心转向生命科学研究和生物技术产品。这种趋势或潮流也不能不说和人类基因组计划密切相关。

数据库是从收录范围和整合程度来判断的。

爱思唯尔期刊全文数据库和NCBI这两个数据库收录的学科范围不同，关键看你想要检索的目的。

爱思唯尔期刊全文数据库收录的是爱思唯尔公司出版的约3000种期刊全文，学科范围为综合性的，包括科技、生物医药及社会科学等。

NCBI 是美国国家生物技术信息中心（National Center for Biotechnology Information）的数据库，NCBI首先创建GenBank数据库，在重点开发GenBank的同时，又于1991年开发了Entrez 数据库检索系统。该系统整合了GenBank、EMBL、PIR和SWISS-PROT等数据库的序列信息以及MEDLINE有关序列的文献信息，并通过相关链接，将他们有机地结合在一起。NCBI还提供了其它数据库，包括在线人类孟德尔遗传（OMIM）、三维蛋白结构的分子模型数据库（MMDB）、人类基因序列集成（UniGene）、人类基因组基因图谱（GMHG）、生物门类（Taxonomy) 等数据库。

问题一：全基因组测序的技术路线提取基因组DNA，然后随机打断，电泳回收所需长度的DNA片段（02~5Kb），加上接头, 进行基因簇cluster制备或电子扩增E-PCR，最后利用Paired-End（Solexa）或者Mate-Pair（SOLiD）的方法对插入片段进行测序。然后对测得的序列组装成Contig，通过Paired-End的距离可进一步组装成Scaffold，进而可组装成染色体等。组装效果与测序深度与覆盖度、测序质量等有关。常用的组装有：SOAPdenovo、Trimity、Abyss等。

问题二：个人全基因组重测序需花费多少钱人类基因组大小3G，重测序一般需要测定至少20x以上的数据（数据乘数高的话对于信息分析是有海的），也就是说一般需要测定60G的数据，如果1G按照5000元算的话，需要30万元。

不过要看你的目的，现在illumina推出的my-seq测1个人的好像只需要几万。

问题三：什么是基因组测序技术自1998年美国塞莱拉遗传公司组建以来，人类基因组研究开始由两部分科学家同时展开，分别是由公共经费支持的人类基因组工程和美国塞莱拉遗传公司。在研究过程中，他们也分别采用了两种不同的测序和分析的方法。塞莱拉公司的核心分析方法被称为霰d法，人类基因组工程则采用了克隆法。

所谓霰d法，其实是一种高度计算机化的方法，它先把基因组随机分成已知长度（2000个碱基对、1万个碱基对、5万个碱基对）的片段，然后用数学算法将这些片段组装成毗邻的大段并确定它们在基因组上的正确位置。

塞莱拉公司的科学家先用霰d法测序DNA，并将整个基因组覆盖8次，然后用两个数学公式将人类基因组序列多次组装起来，确定出基因中的转录单元，预测出60%的已识别基因的分子功能。最后研究人员将人类基因组信息与此前已完成的果蝇和线虫的基因组序列进行比较，从而找出了三者共有的核心功能。

而人类基因组工程采用的克隆法则通过先复制更大段的人类基因序列，然后将它们绘制到基因组的适当区域进行研究。这种方法需要研究人员在早期把较多的时间和精力放到克隆和绘制草图上。

两个研究组将所得数据进行对比，经人类基因组工程的科学家、《科学》和《自然》杂志高级指导编辑评估，表明塞莱拉公司的基因组分析与人类基因组工程的分析结果虽然存在一些差异，但大部分地方都有极高的吻合度。

塞莱拉公司测定的序列覆盖了95%以上的人类基因组，其中约85%的人类基因组存在于按照正确顺序排列、至少包含50万个碱基对的片段中。这一序列为人类至少拥有26383万个控制合成蛋白质的基因提供了有力的证据，也为另外12731万个假设基因的存在提供了较弱的证据

问题四：RNA测序与整个基因组测序相比有什么优势 RNA测序也就是所谓的RNA-seq，通常指的是转录组测序，只测细胞中的转录本。只有基因组中被转录出来的那部分能测到。通常用于寻找差异表达基因以及发现新基因。而基因组测序是整个基因组都测，不管转录不转录，通常用于基因组组装，重测序进行基因分型等。

这是根本不同的两个东西，一个是测转录组，一个是测基因组，它们的不同就是转录组和基因组的不同。至于优势，根据自己的目的来判断吧。

欢迎追问。

问题五：个人基因组测序有哪些意义理论上说，知道了序列，就可以确定这个人的基因，从而能够知道这个人的表型特征，或者对那些病是易感的，以后有可能得什么病，以及对将来对孩子的遗传等等…

但目前来说，个人的全基因组还没有什么用，因为现在我们对基因组中序列的信息了解的还太少，如SNP相关疾病，多基因遗传病等。在科研上全基因组测序，可以为我们提供数据库，以便分析相关的特征。

随着代号为AK1的韩国人的测序成功,目前世界上只有5个人进行了，全基因组测序，另外四个是：一名非洲优鲁巴人、基因研究的先驱詹姆斯・沃森、克里格・文特和一名代号为YH的中国人。

问题六：基因组测序的测序深度一般是多少基因组测序的测序深度一般是10X。

测序深度是指测序得到的总碱基数与待测基因组大小的比值。假设一个基因大小为2M，测序深度为10X，那么获得的总数据量为20M。

基因测序是一种新型基因检测技术，能够从血液或唾液中分析测定基因全序列，预测罹患多种疾病的可能性，个体的行为特征及行为合理，如癌症或白血病，运动天赋，酒量等。

完成人类基因组序列完成图

⑴ 从当前物理图谱生成的克隆产生完成的序列，覆盖基因组的常染色质区域大于96%。大约1Gb的完成序列已经实现。剩下的也已经形成草图，所有的克隆期望达到8～10倍的覆盖率，大约2001年中期（9999%的正确率），使用已经建立的和日益自动化的协议。

⑵ 检测另外的库来关闭gaps。使用FISH技术或其他方法来分析没有闭合的Gaps大小。22，21条染色体用这种方式。2003年已经完成。

⑶ 开发新的技术来关闭难度较大的gaps，大约几百个。

基因组序列工作框架图（Working draft）：通过对染色体位置明确的BAC连续克隆系4-5倍覆盖率的测序（在BAC克隆水平的覆盖率不应低于3倍），获得基因组90%以上的序列，其错误率应低于1%。工作框架图可用于基因组结构的认识、基因的识别和解析、疾病基因的定位克隆，SNP的发现等。

草图的作用

1、草图，许多疾病相关的基因被识别

2、SNP（人与人之间的区别），草图提供了一个理解遗传基础和人类特征进化的框架。

3、草图后，研究人员有了新的工具来研究调节区和基因网络。

4、比较其它基因组可以揭示共同的调控元件，和其他物种共享的基因的环境也许提供在个体水平之上的关于功能和调节的信息。

5、草图同样是研究基因组三维压缩到细胞核中的一个起点。这样的压缩可能影响到基因调控

6、在应用上，草图信息可以开发新的技术，如DNA芯片、蛋白质芯片，作为传统方法的补充，目前，这样的芯片可以包含蛋白质家族中所有的成员，从而在特定的疾病组织中可以找到那些是活跃的。

2001年2月12日，美国Celera公司与人类基因组计划分别在《科学》和《自然》杂志上公布了人类基因组精细图谱及其初步分析结果。其中，政府资助的人类基因组计划采取基因图策略，而Celera公司采取了“鸟q策略”。至此，两个不同的组织使用不同的方法都实现了他们共同的目标：完成对整个人类基因组的测序的工作；并且，两者的结果惊人的相似。整个人类基因组测序工作的基本完成，为人类生命科学开辟了一个新纪元，它对生命本质、人类进化、生物遗传、个体差异、发病机制、疾病防治、新药开发、健康长寿等领域，以及对整个生物学都具有深远的影响和重大意义，标志着人类生命科学一个新时代的来临。

众多发现

1、分析得知：全部人类基因组约有291Gbp，约有39000多个基因；平均的基因大小有27kbp；其中G+C含量偏低，仅占38%，而2号染色体中G+C的含量最多；到目前仍有9%的碱基对序列未被确定，19号染色体是含基因最丰富的染色体，而13号染色体含基因量最少等等（具体信息可参见cmbi 特别报道：生命科学的重大进展）。

2、目前已经发现和定位了26000多个功能基因，其中尚有42%的基因尚不知道功能，在已知基因中酶占1028%，核酸酶占75%，信号传导占122%，转录因子占60%，信号分子占12%，受体分子占53%，选择性调节分子占32%，等。发现并了解这些功能基因的作用对于基因功能和新药的筛选都具有重要的意义。

3、基因数量少得惊人：一些研究人员曾经预测人类约有14万个基因，但Celera公司将人类基因总数定在26383万到39114万个之间，不超过40,000，只是线虫或果蝇基因数量的两倍，人有而鼠没有的基因只有300个。如此少的基因数目，而能产生如此复杂的功能，说明基因组的大小和基因的数量在生命进化上可能不具有特别重大的意义，也说明人类的基因较其他生物体更'有效'，人类某些基因的功能和控制蛋白质产生的能力与其他生物的不同。这将对我们目前的许多观念产生重大的挑战，它为后基因组时代中生物医学的发展提供新的非凡的机遇。但由于基因剪切，EST数据库的重复以及一些技术和方法上的误差，将来亦可能人类的基因数会多于4万。

4、人类单核苷酸多态性的比例约为1/1250bp，不同人群仅有140万个核苷酸差异，人与人之间9999%的基因密码是相同的。并且发现，来自不同人种的人比来自同一人种的人在基因上更为相似。在整个基因组序列中，人与人之间的变异仅为万分之一，从而说明人类不同“种属”之间并没有本质上的区别。

5、人类基因组中存在“热点”和大片荒漠。在染色体上有基因成簇密集分布的区域，也有大片的区域只有“无用DNA” ——不包含或含有极少基因的成分。基因组上大约有1/4的区域没有基因的片段。在所有的DNA中，只有1%-15%DNA能编码蛋白，在人类基因组中98%以上序列都是所谓的“无用DNA”，分布着300多万个长片断重复序列。这些重复的“无用”序列，决不是无用的，它一定蕴含着人类基因的新功能和奥秘，包含着人类演化和差异的信息。经典分子生物学认为一个基因只能表达一种蛋白质，而人体中存在着非常复杂繁多的蛋白质，提示一个基因可以编码多种蛋白质，蛋白质比基因具有更为重要的意义

6、男性的基因突变率是女性的两倍，而且大部分人类遗传疾病是在Y染色体上进行的。所以，可能男性在人类的遗传中起着更重要的作用。

7、人类基因组中大约有200多个基因是来自于插入人类祖先基因组的细菌基因。这种插入基因在无脊椎动物是很罕见的，说明是在人类进化晚期才插入我们基因组的。可能是在我们人类的免疫防御系统建立起来前，寄生于机体中的细菌在共生过程中发生了与人类基因组的基因交换。

8、发现了大约一百四十万个单核苷酸多态性，并进行了精确的定位，初步确定了30多种致病基因。随着进一步分析，我们不仅可以确定遗传病、肿瘤、心血管病、糖尿病等危害人类生命健康最严重疾病的致病基因，寻找出个体化的防治药物和方法，同时对进一步了解人类的进化产生重大的作用。

9、人类基因组编码的全套蛋白质（蛋白质组）比无脊椎动物编码的蛋白质组更复杂。人类和其他脊椎动物重排了已有蛋白质的结构域，形成了新的结构。也就是说人类的进化和特征不仅靠产生全新的蛋白质，更重要的是要靠重排和扩展已有的蛋白质，以实现蛋白质种类和功能的多样性。有人推测一个基因平均可以编码2-10种蛋白质，以适应人类复杂的功能。

模式生物：酵母（yeast）、大肠杆菌（Escherichia coli）、果蝇（Drosophila melanogaster）、线虫（Caenorhabditis elegans）、小鼠（Mus musculus）、拟南芥、水稻、玉米等等其它一些模式生物的基因组计划也都相继完成或正在顺利进行。

目前基因组学的研究出现了几个重心的转移：一是将已知基因的序列与功能联系在一起的功能基因组学研究；二是从作图为基础的基因分离转向以序列为基础的基因分离；三是从研究疾病的起因转向探索发病机理；四是从疾病诊断转向疾病易感性研究。

在后基因组时代，如果在已完成基因组测序的物种之间进行整体的比较、分析，希望在整个基因组的规模上了解基因组和蛋白质组的功能意义，包括基因组的表达与调控、基因组的多样化和进化规律以及基因及其产物在生物体生长、发育、分化、行为、老化和治病过程中的作用机制都必须发展新的算法以充分利用超级计算机的超级计算能力。

美国和英国科学家2006年5月18日在英国《自然》杂志网络版上发表了人类最后一个染色体——1号染色体的基因测序。

在人体全部22对常染色体中，1号染色体包含基因数量最多，达3141个，是平均水平的两倍，共有超过223亿个碱基对，破译难度也最大。一个由150名英国和美国科学家组成的团队历时10年，才完成了1号染色体的测序工作。

科学家不止一次宣布人类基因组计划完工，但推出的均不是全本，这一次杀青的“生命之书”更为精确，覆盖了人类基因组的99．99%。解读人体基因密码的“生命之书”宣告完成，历时16年的人类基因组计划书写完了最后一个章节。人类基因组计划中还包括若干个模式生物体基因组计划，中国重点支持的水稻基因组研究计划亦可划入这一范畴。模式生物体一直就是生命科学领域研究的基本模型，加之它们与人类相比基因组结构简单、单位DNA长度上基因密度高，易于基因的识别，而且从低等至高等的各个模式生物是研究基因分子进化的绝佳材料。各模式生物体之间的比较性研究将有助于人类基因的结构与功能的阐明。对于在整体水平研究基因的功能，模式生物体更有着无法取代的地位。

中国的基因组研究工作起步较晚，而且是基础差、底子薄、资金少，与国际上这几年HGP的惊人速度相比，中们的差距很大，并且这种差距有进一步加大的可能。中国生命科学界应在如下几个方面共同努力：

⒈ 尽快收集和利用中国宝贵的多民族基因组资源和遗传病家系材料，并阻止这些资源盲目流向国外。

⒉ 集中人力、物力和财力，建立互相配套的、集分子遗传学、自动化技术和信息技术为一体的中心，才能卓有成效地开展工作。

⒊ 根据中国国情和原有工作基础，做到有所为有所不为，走“短平快”和出奇制胜的道路，直接楔入基因组研究中最为关键的部分－基因识别，如走“cDNA计划”道路，尽可能地克隆一大批新基因，在人类8万～10 万个基因中占有一定的份额。同时，由于基因组DNA测序是一项劳动和技能密集性工作，如能引进技术，培训一支高水平的技术队伍，完全有可能将人类基因组测序的一部分工作吸引到中国。

⒋ 充分利用国际基因数据库中已有信息，建立生物信息技术，推进中国基因组研究工作，并在基因组转录顺序的认识及基因功能推测方面多做工作。

⒌ 多渠道筹措资金，在维护知识产权的前提下开展国际间合作。

历史已将中国当代科学家推上了人类基因组计划这一国际合作和竞争的大舞台，他们责无旁贷地要为供养自己的国家和人民负责，为21世纪中国的科学、技术和产业负责，唯有高瞻远瞩地认清当前的形势和不辞劳苦、不计得失地拼搏，才有可能在国际人类基因组计划中占有一席之地，有着交换和分享数据的资本，共同品尝人类基因组这一全人类的“圣餐”。

中国1994年启动HGP，现已完成南北方两个汉族人群和西南、东北地区12个少数民族共733个永生细胞系的建立，为中华民族基因保存了宝贵的资源，并在多民族基因组多样性的研究中取得了成就，在致病基因研究中有所发现。定名为中华民族基因组结构和功能研究的HGP为“九五”国家最大的资助研究项目之一（700万元），为中国在下世纪国际HGP科学的新一轮竞争中占据有利地位打好了基础。

以上就是关于人类基因组计划全部的内容，包括:人类基因组计划、人类基因组计划的主要实例、爱思唯尔期刊全文数据库和NCBI哪个强大等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/sjk/9455733.html

人类基因组计划

发表评论

评论列表（0条）