生物芯片技术是随着"人类基因组计划"(human genome project, HGP)的进展而发展起来的,它是90年代中期以来影响最深远的重大科技进展之一,它融微电子学、生物学、物理学、化学、计算机科学为一体的高度交叉的新技术,具有重大的基础研究价值,又具有明显的产业化前景。生物芯片技术包括基因芯片、蛋白质芯片、细胞芯片、组织芯片、以及元件型微阵列芯片、通道型微阵列芯片、生物传感芯片等新型生物芯片(1)。本文主要讨论基因芯片技术,它为"后基因组计划"时期基因功能的研究提供了强有力的工具,将会使基因诊断、药物筛选、给药个性化等方面取得重大突破,该技术被评为1998年度世界十大科技进展之一。
1 基本概念
基因芯片(gene chip)也叫DNA芯片、DNA微阵列(DNA microarray)、寡核苷酸阵列(oligonucleotide array),是指采用原位合成(in situ synthesis)或显微打印手段,将数以万计的DNA探针固化于支持物表面上,产生二维DNA探针阵列,然后与标记的样品进行杂交,通过检测杂交信号来实现对生物样品快速、并行、高效地检测或医学诊断,由于常用硅芯片作为固相支持物,且在制备过程运用了计算机芯片的制备技术,所以称之为基因芯片技术。
2 技术基本过程
2.1 DNA方阵的构建
选择硅片、玻璃片、瓷片或聚丙烯膜、尼龙膜等支持物,并作相应处理,然后采用光导化学合成和照相平板印刷技术可在硅片等表面合成寡核苷酸探针;(2)或者通过液相化学合成寡核苷酸链探针,或PCR技术扩增基因序列,再纯化、定量分析,由阵列复制器(arraying and replicating device ARD),或阵列机(arrayer)及电脑控制的机器人,准确、快速地将不同探针样品定量点样于带正电荷的尼龙膜或硅片等相应位置上,再由紫外线交联固定后即得到DNA微阵列或芯片(3)。
2.2 样品DNA或mRNA的准备。
从血液或活组织中获取的DNA/mRNA样品在标记成为探针以前必须进行扩增提高阅读灵敏度。Mosaic Technologies公司发展了一种固相PCR系统,好于传统PCR技术,他们在靶DNA上设计一对双向引物,将其排列在丙烯酰胺薄膜上,这种方法无交叉污染且省去液相处理的繁锁;Lynx Therapeutics公司提出另一个革新的方法,即大规模平行固相克隆(massively parallel solid-phase cloning)这个方法可以对一个样品中数以万计的DNA片段同时进行克隆,且不必分离和单独处理每个克隆,使样品扩增更为有效快速(4)。
在PCR扩增过程中,必须同时进行样品标记,标记方法有荧光标记法、生物素标记法、同位素标记法等。
2.3 分子杂交
样品DNA与探针DNA互补杂交要根据探针的类型和长度以及芯片的应用来选择、优化杂交条件。如用于基因表达监测,杂交的严格性较低、低温、时间长、盐浓度高;若用于突变检测,则杂交条件相反(5)。芯片分子杂交的特点是探针固化,样品荧光标记,一次可以对大量生物样品进行检测分析,杂交过程只要30min。美国Nangon公司采用控制电场的方式,使分子杂交速度缩到1min,甚至几秒钟(6)。德国癌症研究院的Jorg Hoheisel等认为以肽核酸(PNA)为探针效果更好。
2.4 杂交图谱的检测和分析
用激光激发芯片上的样品发射荧光,严格配对的杂交分子,其热力学稳定性较高,荧光强;不完全杂交的双键分子热力学稳定性低,荧光信号弱(不到前者的1/35~1/5)(2),不杂交的无荧光。不同位点信号被激光共焦显微镜,或落射荧光显微镜等检测到,由计算机软件处理分析,得到有关基因图谱。目前,如质谱法、化学发光法、光导纤维法等更灵敏`、快速,有取代荧光法的趋势。
3 应用
3.1 测序
基因芯片利用固定探针与样品进行分子杂交产生的杂交图谱而排列出待测样品的序列,这种测定方法快速而具有十分诱人的前景。Mark chee等用含135000个寡核苷酸探针的阵列测定了全长为166kb的人线粒体基因组序列,准确率达99%(7)。Hacia等用含有48000个寡核苷酸的高密度微阵列分析了黑猩猩和人BRCA1基因序列差异,结果发现在外显子11约34kb长度范围内的核酸序列同源性在982%到835%之间,提示了二者在进化上的高度相似性(8)。
3.2 基因表达水平的检测。
用基因芯片进行的表达水平检测可自动、快速地检测出成千上万个基因的表达情况。Schena等采用拟南芥基因组内共45个基因的cDNA微阵列(其中14个为完全序列,31个为EST),检测该植物的根、叶组织内这些基因的表达水平,用不同颜色的荧光素标记逆转录产物后分别与该微阵列杂交,经激光共聚焦显微扫描,发现该植物根和叶组织中存在26个基因的表达差异,而参与叶绿素合成的CAB1基因在叶组织较根组织表达高500倍。(9)Schena等用人外周血淋巴细胞的cDNA文库构建一个代表1046个基因的cDNA微阵列,来检测体外培养的T细胞对热休克反应后不同基因表达的差异,发现有5个基因在处理后存在非常明显的高表达,11个基因中度表达增加和6个基因表达明显抑制。该结果还用荧光素交换标记对照和处理组及RNA印迹方法证实(10)。在HGP完成之后,用于检测在不同生理、病理条件下的人类所有基因表达变化的基因组芯片为期不远了(11)。
3.3 基因诊断
从正常人的基因组中分离出DNA与DNA芯片杂交就可以得出标准图谱。从病人的基因组中分离出DNA与DNA芯片杂交就可以得出病变图谱。通过比较、分析这两种图谱,就可以得出病变的DNA信息。这种基因芯片诊断技术以其快速、高效、敏感、经济、平行化、自动化等特点,将成为一项现代化诊断新技术。例如,Affymetrix公司,把P53基因全长序列和已知突变的探针集成在芯片上,制成P53基因芯片,将在癌症早期诊断中发挥作用。又如,Heller等构建了96个基因的cDNA微阵,用于检测分析风湿性关节炎(RA)相关的基因,以探讨DNA芯片在感染性疾病诊断方面的应用(12)。现在,肝炎病毒检测诊断芯片、结核杆菌耐药性检测芯片、多种恶性肿瘤相关病毒基因芯片等一系列诊断芯片逐步开始进入市场。基因诊断是基因芯片中最具有商业化价值的应用。
3.4 药物筛选
如何分离和鉴定药的有效成份是目前中药产业和传统的西药开发遇到的重大障碍,基因芯片技术是解决这一障碍的有效手段,它能够大规模地筛选、通用性强,能够从基因水平解释药物的作用机理,即可以利用基因芯片分析用药前后机体的不同组织、器官基因表达的差异。如果再用m RNA 构建c DNA表达文库,然后用得到的肽库制作肽芯片,则可以从众多的药物成分中筛选到起作用的部分物质。或者,利用RNA、单链DNA有很大的柔性,能形成复杂的空间结构,更有利与靶分子相结合,可将核酸库中的RNA或单链DNA固定在芯片上,然后与靶蛋白孵育,形成蛋白质-RNA或蛋白质-DNA复合物,可以筛选特异的药物蛋白或核酸,因此芯片技术和RNA库的结合在药物筛选中将得到广泛应用。在寻找HIV药物中,Jellis等用组合化学合成及DNA芯片技术筛选了654536种硫代磷酸八聚核苷酸,并从中确定了具有XXG4XX样结构的抑制物,实验表明,这种筛选物对HIV感染细胞有明显阻断作用。(13)生物芯片技术使得药物筛选,靶基因鉴别和新药测试的速度大大提高,成本大大降低。基因芯片药物筛选技术工作目前刚刚起步,美国很多制药公司已开始前期工作,即正在建立表达谱数据库,从而为药物筛选提供各种靶基因及分析手段。这一技术具有很大的潜在应用价值。
3.5 给药个性化
临床上,同样药物的剂量对病人甲有效可能对病人乙不起作用,而对病人丙则可能有副作用。在药物疗效与副作用方面,病人的反应差异很大。这主要是由于病人遗传学上存在差异,如药物应答基因,导致对药物产生不同的反应。例如细胞色素P450酶与大约25%广泛使用的药物的代谢有关,如果病人该酶的基因发生突变就会对降压药异喹胍产生明显的副作用,大约5%~10%的高加索人缺乏该酶基因的活性。现已弄清楚这类基因存在广泛变异,这些变异除对药物产生不同反应外,还与易犯各种疾病如肿瘤、自身免疫病和帕金森病有关。如果利用基因芯片技术对患者先进行诊断,再开处方,就可对病人实施个体优化治疗。另一方面,在治疗中,很多同种疾病的具体病因是因人而异的,用药也应因人而异。例如乙肝有较多亚型,HBV基因的多个位点如S,P及C基因区易发生变异。若用乙肝病毒基因多态性检测芯片每隔一段时间就检测一次,这对指导用药防止乙肝病毒耐药性很有意义。又如,现用于治疗AIDS的药物主要是病毒逆转录酶RT和蛋白酶PRO的抑制剂,但在用药3-12月后常出现耐药,其原因是rt、pro基因产生一个或多个点突变。Rt基因四个常见突变位点是Asp67→Asn、Lys70→Arg、Thr215→Phe、Tyr和Lys219→Glu,四个位点均突变较单一位点突变后对药物的耐受能力成百倍增加(14)。如将这些基因突变部位的全部序列构建为DNA芯片,则可快速地检测病人是这一个或那一个或多个基因发生突变,从而可对症下药,所以对指导治疗和预后有很大的意义。
此外,基因芯片在新基因发现、药物基因组图、中药物种鉴定、DNA计算机研究等方面都有巨大应用价值。
4 基因芯片国内外现状和前景
自从1996年美国Affymetrix公司成功地制作出世界上首批用于药物筛选和实验室试验用的生物芯片,并制作出芯片系统(15),此后世界各国在芯片研究方面快速前进,不断有新的突破。美国的Hyseq公司、Syntexi公司、Nanogen公司、Incyte公司及日本、欧洲各国都积极开展DNA芯片研究工作;摩托罗拉、惠普、IBM等跨国公司也相继投以巨资开展芯片研究。98年12月Affymefrix公司和Molecular Dynamics公司宣布成立基因分析协会(Genetic Analysis Technology Consortium)以制定一个统一的技术平台生产更有效而价谦的设备,与此相呼应,英国的Amershcem Pharmacia Biotechnology公司也在同一天宣布将提供部分掌握的技术以推动这项技术的应用(16)。美国关于芯片技术召开了两次会议,克林顿总统在会上高度赞赏和肯定该技术,将基因芯片看作是保证一生健康的指南针(17)。预计在今后五年内生物芯片销售可达200-300亿美元;据《财富》杂志预测(973),在21世纪,生物芯片对人类的影响将可能超过微电子芯片。
来自北京大学的研究人员在世界上首次创建并发布了长非编码RNA疾病数据库(lncRNA and disease database, LncRNADisease),这一数据库收录了160多种和长非编码RNA有关的疾病,并集成了一个生物信息学工具用以预测新的人类长非编码RNA和疾病的关系。这一研究成果公布在Nucleic Acids Research杂志上。
领导这一研究的是北京大学基础医学院医学信息学系崔庆华副教授,崔博士回国后加入北京大学基础医学院医学信息学系,在5年多的生物信息学研究工作中,他的研究涉及到了生物标记物检测、基因芯片数据分析、基因组学、蛋白质组学以及系统生物学等领域。
在2007年,崔博士研究组创建世界上第一个微小RNA疾病数据库,也是更新最频繁、数据量最大的微小RNA疾病数据库,而最新这一研究成果是在之前研究的基础上取得的。
所谓长非编码RNA疾病,是指由于长非编码RNA异常而引发的各种疾病,其实关于非编码RNA在疾病发生、发展和防治中的作用已有大量文献报导,特别是siRNA、miRNA、和RNAi已经成为现代医学生理和病生理学的研究重点,但是关于长非编码RNA与疾病发病和防治之间关联的研究,还仅仅走出了第一步。
此前一些研究表明LncRNAs及其相关结合蛋白的转录、表达、结构和调控的异常可能是肿瘤、老年痴呆、自闭症等许多重要疾病发生和发展的重要原因,还有科学家发现9p21邻近CdKn2A基因区域的LncRNA-ANRIL失调可以引起冠心病,以及LncRNA-MIAT(RNCR2)失常可引起心肌梗塞,此外研究人员还发现脑卒中时有LncRNAs的表达谱的广泛异常表达。
为了能建立已发现的上万个长非编码RNA与疾病的密切关系,崔博士等人构建了长非编码RNA疾病数据库(lncRNA and disease database, LncRNADisease),这是国际上第一个长非编码RNA疾病数据库,收录了160多种和长非编码RNA有关的疾病,LncRNADisease也对长非编码RNA与疾病之间的关系做了详细注释,这一数据库还集成了一个生物信息学工具用以预测新的人类长非编码RNA和疾病的关系。
LncRNADisease收录了有实验支持的9445条记录,包括591个微小RNA基因和396种人类疾病(2012年9月份数据),目前这一数据库拥有来自六大洲40多个国家的上千个用户,已经成为国际上研究微小RNA和人类疾病关系的重要生物信息学平台,为微小RNA和人类疾病关系研究做出了贡献。
长非编码RNA疾病数据库的创建和不断完善不仅收集和整合了lncRNA与疾病的各种数据和资料,可以进行有效查询和检索,而且所开发的生物信息学软件还可对各种已知和未知的长非编码RNA和疾病的关系进行预测和指导,它将成为研究长非编码RNA和疾病的关系一个有力的工具。
关于长非编码RNA,崔博士表示,最初人们普遍认为lncRNA仅仅是基因的“转录噪声(transcriptional noise)”,然后近年来越来越多有功能的非编码RNA被发现,当然,也有一些非编码RNA确实是转录噪声。判断一个lncRNA是否是转录噪声,一个简单的方法就是调查该lncRNA的表达谱,如果一个lncRNA没有功能,是转录噪声,那么该lncRNA的表达没有组织差异,在同一种组织的不同发育阶段也没有差异。另一个办法是调查该lncRNA序列的变异情况,如果一个lncRNA没有功能,则其核苷酸替换将没有自然选择的压力,将表现为“中性”。
崔博士还指出了当前lncRNA的研究重点主要包括:lncRNA的分类以及lncRNA的识别和鉴定,以及lncRNA和其他生物元素的相互作用的系统生物学研究,除此之外,还有lncRNA在重大疾病发生发展中的作用,lncRNA作为疾病分子标记物和药物靶点的潜力研究。
归一化
microRNA芯片采用的归一化的方法为quantile normalization,loess normalization。
差异基因筛选
microRNA的差异筛选,同表达谱的筛选方法是一致的,参见表达谱的差异基因筛选。
miRNA靶基因预测
microRNA结合在靶基因的3’ UTR,下调靶基因.miRNA靶基因预测有多种方法.我们利用TargetScan数据库关联microRNA的靶基因。
4 miRNA与靶基因网络图
将显著性功能与显著性Pathway所包含的靶基因取交集后与microRNA构建基因与microRNA调控网络(待确认),可以在全局的水平上直观的反应基因之间的相互关系,同时反映了基因调控网络的稳定性。根据网络中microRNA的位置函数计算出microRNA在网络中的关系强度,即microRNA的网络特征值。特征值最高microRNA处于网络的枢纽性地位,该microRNA调控能力最强,对网络结构和样本性状有重要的调控价值,同时从网络中也可以得到被microRNA调控的关键靶基因。
5 miRNA-GO Network
miR-GO Network利用靶基因的功能注释与microRNA-mRNA靶向调控关系,构建microRNA功能调控的网络图。网络图可发现MicroRNA调控的多种基因功能,并通过网络分析,得到核心调控microRNA以及microRNA调控的核心基因功能。
6 miRNA-Pathway Network
miR- Pathway Network与miR-GO Network类似.利用靶基因的Pathway间相互作用关系,与microRNA-mRNA靶向调控关系,构建miR- Pathway调控的网络图。网络图可发现MicroRNA调控的多种信号通路,并通过网络分析,得到核心调控microRNA以及microRNA调控的核心信号通路。
7 miRNA的转录因子的预测
为了研究miRNA的调控机制,首先预测miRNA的promoter区域,根据miRNA的promoter区域,利用HMM来预测结合的转录因子。
8 miRNA与表达谱芯片平台的联合分析
miRNA与表达谱芯片平台的联合分析除了和甲基化与表达谱芯片分析类似外,还可以将miRNA预测的靶基因和表达谱芯片的差异基因取交集,进行miRNA-DiffGene-Network。
生物信息学,是一门综合学科。涉及到数学,生物学和计算机的内容。但在我看来,计算机的基础需要,但要求不是很高,关键是要有很好的生物学知识,包括遗传学的、生物化学的、发育生物学的、分子生物学的、植物生理学的知识等等,也就说需要达到这样的一个要求:在进行数据分析时,能对各种分析结果进行生物学的评价,并给出最优的分析策略。同时也应该有纯熟的数理基础,包括统计学的、拓扑学的,这样才能把待分析的问题转换成可计算的模型,最后能给出实现的程序。
从个人来说,因为生物信息学是一个非常大的领域,所以,关键是要确定自己的研究方向。比如,以关联分析为方向的生物信息学,那么就要掌握好各种关联分析的统计分析方法,有很强的数据管理能力,足够好的序列分析能力(这是进行variation查找和分析的基础)。
回到6年以前,如果决定在生物信息学上发展,那么我也许会做下面这些事情:
首先,从最不重要的计算机这个方面来说:
(1)要掌握好bash等脚本语言,一般的linux问题都能很好的解决
(2)熟练使用apache,mysql等基础软件工具,用joomla等CMS配置搭建网站
(3)应该努力精通perl,bioperl,以基于此的各种分析工具,比如gbrowser,cmap等
(4)足够好的c/c++语言能力,这是实现新算法的最高效语言。
(5)应该努力精通R语言,这是进行统计分析的基础工具
(6)如果有机会,学学erlang这样一些函数式语言吧
其次,从数学基础来说,我觉得应该:
(1)学好线性代数
(2)学好高等数学,或者数学分析
(3)学好统计学
(4)学好离散数学
(5)学好计算机算法和数据结构
其次,从生物学来说:
(1)如果没有进化论的基层,请把进化论学好
(2)学好发育生物学,植物生理学
(3)学好基因组学、遗传学等
千万不要认为这些没有什么用,当你在数据分析,怎么判断结果的合理性,或者对结果进行解释时候,都离不开这些生物学问题。最后,你对这些问题的理解成度,决定了你的生物信息学水平:只是一个有生物学知识的、会进行计算机 *** 作的技术员,还是一个能给出解决方案的有良好计算机基础的能把握生物学问题的生物信息学家。
最后,从生物信息学的角度来说:
(1)对NCBI等各大数据库非常熟悉
(2)对各种生物学信息学的分析方法和策略非常的清楚,至少应该知道有那些工具软件,以及这些工具软件的原理和基于的生物学基础,包括:基因组学分析,表达谱分析,代谢组分析、调控网络分析、数据结果的整合展示等
最后,生物信息学是一个发展很快的学科,但因起涉及的内容比较多,因此,要想到底一定的要求,是需要付出巨大的努力的。此外,在进行生物信息学学习的过程中,对自己感兴趣的方法工具,一定要把文献上的数据拿来,自己独立分析一遍,自己去体会分析的过程,从而对这些方法和工具有更深入的理解。
以上就是关于生物芯片的定义\原理\作用\应用领域全部的内容,包括:生物芯片的定义\原理\作用\应用领域、近年疾病趋势查询在什么数据库查询、miRNA表达谱的生物信息学分析有哪些方面的内容等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)