生物芯片技术是通过缩微技术,根据分子间特异性地相互作用的原理,将生命科学领域中不连续的分析过程集成于硅芯片或玻璃芯片表面的微型生物化学分析系统,以实现对细胞、蛋白质、基因及其它生物组分的准确、快速、大信息量的检测。按照芯片上固化的生物材料的不同,可以将生物芯片划分为基因芯片、蛋白质芯片、细胞芯片和组织芯片。生物芯片技术与传统的仪器检测方法相比具有高通量、微型化、自动化、成本低、防污染等特点。按照生物芯片的制作技术,可以将生物芯片划分为微矩阵和原位合成芯片。鉴于生物芯片技术领域的飞速发展,美国科学促进会将生物芯片评为1998年的十大科技突破之一,认为生物芯片技术将是继大规模集成电路之后的又一次具有深远意义的科学技术革命。
目前,最成功的生物芯片形式是以基因序列为分析对象的“微阵(microarray)”,也被称为基因芯片(Genechip)DNA芯片(DNAchip)。按照载体上点的DNA种类的不同,基因芯片可分为寡核苷酸和cDNA两种芯片。按照基因芯片的用途可分为表达谱芯片、诊断芯片、指纹图谱芯片、测序芯片、毒理芯片等等。早在八十年代初期,Bains等人就用杂交的方法对固定在支持物上的短DNA片段进行序列测定。基因芯片技术从实验阶段走向工业化是得益于其他技术的引入,如激光共聚焦显微技术、探针固相原位合成技术与照相平板印刷技术的结合和双色荧光探针杂交系统的建立。90年代初期人类基因组计划(HumanGenomeProject,HGP)和分子生物学相关学科的发展也为基因芯片技术的出现和发展提供了有利条件。1992年,Affymatrix公司Fodor领导的小组运用半导体照相平板技术,对原位合成制备的DNA芯片作了首次报道,这是世界上第一块基因芯片。1995年,Stanford大学的P.Brown实验室发明了第一块以玻璃为载体的基因微矩阵芯片。标志着基因芯片技术进入了广泛研究和应用的时期。 1、靶基因用于芯片点样的是靶基因。靶基因可分为染色体DNA(或基因组DNA)、cDNA(或人工合成DNA)。以cDNA的研究为主,因为cDNA是染色体上编码蛋白质的DNA序列,有医疗和其他领域的研究价值和商业价值。 2、制备技术基因芯片的制备综合了生命科学、化学染料、微电子技术、激光、统计学等领域的前沿技术,主要包括芯片的制备(选择点样仪和玻片、靶基因的扩增和固定)、杂交探针的制备(mRNA的抽提、mRNA的逆转录、PCR和探针荧光标记)、杂交条件的优化技术(杂交液、杂交条件和洗涤条件的选择)和数据分析技术。其中,基因芯片的制备主要依赖于微细加工(microfabrication)、自动化(automatism)及化学合成技术。通常比较典型的DNA芯片制备方法有3种:(1)原位合成法(insitusynthesis)以Affymetrix公司开发的光引导原位合成法为代表(2)合成点样法又根据是否与芯片的表面接触分为化学喷射法和接触式点涂法,分别以IncytePharmaceutical公司和Stanford大学为代表(3)压电法通过使用4支分别装有A、T、G、C核苷的压电喷头在芯片上作原位DNA探针合成。
测序,简单来说就是将DNA化学信号转变为计算机可处理的数字信号。
一代测序
首先讲一下测序的基础方法,Sanger测序 (Sanger et al.,1977)
1977年Frederick Sanger和同事发展出双脱氧测序法(dideoxy sequencing method)或称链终止法,并对噬菌体phiX-174测序以来,测序原理并未有太多变化。后来测序方法的改革也几乎都是在此基础上,缩短时间,降低人力,比如①在每一种ddNTP中掺入不同的荧光标记,使测序在单一反应中就能进行。②使用极薄极长的充胶玻璃毛细管代替大的聚丙烯酰胺凝胶块,新的介质散热更快,使电泳能在高压下进行,降低分离时间等诸如此类的减少分离时间的变革。③更换探查单一核苷酸的方法,用微转换器控制通过的电流检测核苷酸等等。
Sanger法测序需要引物,DNA聚合酶,脱氧核糖核苷三磷酸(dNTPs),有限量的双脱氧核苷三磷酸(ddNTPs)。按照碱基配对原则,dNTPs在引物之后按照模板延伸,ddNTPs的随机加入会由于它缺乏连接下一个的3’羟基而导致反应终止,由于ddNTPs的结合位置随机,我们会得到一系列大小不同的片段,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或同位素标记进行检测。也正是这个原理,所以测序得到较长的序列的概率低,长序列往往需要双向测序再进行拼接。
Maxam gilbert 化学法测序 (Maxam and Gilbert,1977)
几乎同时,Maxam和Gilbert发明了化学链降解法测序。
通过化学终止反应测序。首先双链变单链,准备工作完成。采用特定的化学试剂来从DNA链上断裂特定碱基,在5’端磷酸化(32P),四种化学反应:G反应,A+G反应,T+C反应,C反应,分别进行并产生一系列片段。然后进行电泳(electrophoresis),放射自显影(radioautography),最后可以整理得到序列。
二代测序(目前拥有这些测序仪的公司主要有Illumina,Thermo Fisher Scientific(已收购life,ABI, Ion torrent公司,所以在TFS官网可以找到这些测序仪),Roche)
一些和前后都没有紧密联系的概念
深度测序(deep sequencing)不是什么测序方法,而是根据对目的基因测序的depth和coverage(C)对测序方法的归类。如果这个片段被测序了大于7次(coverage>7),那么基本可以说是深度测序,大于100×称为ultra deep sequencing。还有一些概念比如length of genome(G)指全基因组长度,number of reads(N)片段数量,average read length(L)。
C=N×(L/G)
pyrosequencing 焦磷酸测序法 (Ronaghi, 2001) -454 二代测序 (Jarvie, 2005)
焦磷酸测序法
它后来发展称为Roche公司454技术所使用的测序方法。
是一种酶联级联测序技术,准确度可与Sanger媲美,且速度大大提高。具备同时对大量样品进行测序分析的能力,为大通量,低成本,快速地进行单核苷酸多态性(single nucle-otide potymorphisms, SNPs)研究提供了理想的技术支持。改进后的焦磷酸测序技术可以满足上百个核苷酸测序。但是测序长度一般在100bp左右,一直用于短序列分析。它的技术原理是4种酶在同一反应体系种级联化学发光反应,引物与模板DNA退火后,在DNA聚合酶,ATP硫酸化酶(ATP sulfurytase),荧光素酶(luciferase)和磷酸酶(Apyrase)协同作用下,检测荧光,实时测定DNA序列。
454测序-固定的焦磷酸测序体系(2016年被Roche公司淘汰)
首先是序列处理:全基因组DNA处理为小的片段(鸟q法处理的),在一端连接两端分别连接A和B(可以在PCR中产生大量的目的序列),然后解链变成带有adaptors的单链DNA,这个adaptorA的序列可以与小珠子上面的短序列B匹配,这样我们要测序的片段就被固定了。小珠子是不可溶的且与酶不反应的分子,作为固定表面。然后进行乳化PCR,得到了满载分子的小珠子并将它们放入小孔。接下来是焦磷酸测序的原理,引物是adaptorA,每次反应加一种dNTP,如果可以碱基配对,会在DNA聚合酶下结合在引物末端,释放一个分子的焦磷酸(PPi)。在ATP硫酸化酶作用下,PPi与APS结合形成ATP,ATP与荧光素在荧光素酶作用下形成氧化荧光素,产生可见光。反应后冲洗掉剩余dNTP和少量ATP。
大多数现代测序方法都是分为这几步,主旨是实现高通量和自动化。①全基因组片段化。②adapter ligation末端连接短序列。③目标DNA与分子小珠子的结合。④将小珠子加载到孔板。⑤采用适合的方法测序。⑥数据处理。
连接酶法测序(Sequencing by ligation) (Albrecht et al.,2000) -ABI 公司SOLID测序 (Hedges et al.,2011)
连接酶测序法
利用的是DNA ligase的一个特性。连接酶是将DNA分子末端连接在一起的酶,它对DNA结构敏感,如果两条链的碱基不匹配,那么酶的效率很低。
具体如下图,模板链连接P1Adaptor,引入引物Pn与探针寡核苷酸混合物,一般8-9bp,前两个是与模板结合的碱基,中间三个为universal配对,后三个也是且5’连接荧光标记。在酶的作用下,正确配对的探针偏向与模板结合,然后荧光信号被检测并切除,露出5’端,继续反应。中间NNN的碱基部分可以通过加入引物Pn-1的方法,进行错位测序,之后整合数据。
ABI公司SOLID测序平台
在前期准备上与454测序相似,也会用到小分子的beads。但是测序方法为连接酶法,不是焦磷酸。
鸟q法(shotgun sequencing) (Sutton et al.,1995) 测序- Ion torrent 公司PGM测序 (Merriman et al.,2012)
鸟q法
传统的sanger法适合短一些的序列,当处理比如人类基因组的长序列时,需要鸟q法将长序列变成短序列。并不是一个独特的测序方法,应该算是前处理技术。这些通过鸟q法处理得到的短序列位点和长度随机,称为contigs(重叠群/连接片段)。然后用不同的测序方法测序,将结果输入电脑,它用算法(algorithm)将contigs的重叠部分进行拼接,得到完整序列。
Ion Torrent公司Proton测序仪
此方法比较快速。测序的原理与其他的不同,检测的不是荧光信号,而是核苷酸结合时释放的氢离子H+。同样全基因组→片段化,单链→连接adaptor→adaptors配对连接beads小分子→乳化PCR amplify。这些步骤与其他二代测序一样,不同的是Ion Torrent采用半导体芯片代替之前的孔板,加载携带序列的小分子在芯片上,芯片由可以承载小分子beads的孔和感受pH的传感器构成,这样前期准备就完成了。测序也是逐个加入四种核苷酸,检测产生的氢原子对溶液pH的影响,收集处理信号。
illumina 公司测序平台目前占据大部分市场,以HiSeq系列为主 (Quail et al., 2008)
特点是很便宜,速度也很快。①前期对基因组的片段化以及两端连接adaptorA,B与其他二代测序技术类似,②不同的是它没有用beads,核心反应容器是可以吸附流动DNA片段的测序流动槽(flowcell),每个flowcell上有8个道(lane),lane上面有与adaptorA,B相互配对的序列,所以可以固定DNA。③桥式PCR扩增与变性。先因为adaptorA,B序列而结合,形成拱桥性状,开始扩增,完成后双链和两端会再变性分开,新产生的单链作为模板再开始桥式反应。最后的结果是会产生一簇正反向的目的片段(详见下图)。④测序,检测荧光信号,整合结果。
第三代测序
PacBio公司的SMRT和OxfordNanopore Technologies纳米孔单分子测序技术被称为第三代测序技术。其特点是不需要进行扩增,就是说小分子beads/桥式PCR的步骤是不需要的,而且产生的reads(读长)较长(>20kb)。
PacBio 公司的SMRT (Rhoads and Au,2015)
这个方法有点在上面提了,且速度快,由于是实时检测,所以还可以检测碱基的表观修饰情况,如甲基化。但是缺点是错误率太高,以缺失序列和错位居多。SMRT芯片为测序载体(如同flowcell),不同碱基用不同荧光标记,在合成配对时检测荧光信号。
实现实时长序列测序的关键第一是采用的DNA聚合酶的活性保持,第二是区分配对的反应信号与周围游离碱基的强大背景荧光,采用零模波导孔原理,在反应管(SMRTCell:单分子实时反应孔)中有许多圆形纳米小孔达到降噪检测的目的。
Oxford Nanopore 的MinION (Mikheyev and Tin,2014)
是基于电信号的测序。它的特点是仪器真的非常小,reads更加长(几十甚至上百kb),而且DNA在测序中不被破坏,但是错误率同样很高。它能够直接读取出甲基化的胞嘧啶,而不必像二代测序方法那样需要事先对基因组进行bisulfite处理,这是因为存在表观修饰的碱基激发的电流强度是不同的。这对于在基因组水平直接研究表观遗传等相关现象有极大的帮助。
技术核心是特殊的纳米孔,孔内共价结合分子接头。当DNA分子通过纳米孔时,它们使电荷发生变化,从而短暂地影响流过纳米孔的电流强度(每种碱基所影响的电流变化幅度是不同的),最后高灵敏度的电子设备检测到这些变化从而鉴定所通过的碱基。
参考文献
Albrecht, G., Brenner, S., Dubridge, R.B., Lloyd, D.H., and Pallas, M.C. (2000) Massively parallel signature sequencing by ligation of encoded adaptors. In: Google Patents.
Hedges, D.J., Guettouche, T., Yang, S., Bademci, G., Diaz, A., Andersen, A. et al. (2011) Comparison of three targeted enrichment strategies on the SOLiD sequencing platform. PloS one 6 .
Jarvie, T. (2005) Next generation sequencing technologies. Drug Discovery Today: Technologies 2 : 255-260.
Maxam, A.M., and Gilbert, W. (1977) A new method for sequencing DNA. Proceedings of the National Academy of Sciences 74 : 560-564.
Merriman, B., D Team, I.T., and Rothberg, J.M. (2012) Progress in ion torrent semiconductor chip based sequencing. Electrophoresis 33 : 3397-3417.
Mikheyev, A.S., and Tin, M.M. (2014) A first look at the Oxford Nanopore MinION sequencer. Molecular ecology resources 14 : 1097-1102.
Quail, M.A., Kozarewa, I., Smith, F., Scally, A., Stephens, P.J., Durbin, R. et al. (2008) A large genome center's improvements to the Illumina sequencing system. Nature methods 5 : 1005.
Rhoads, A., and Au, K.F. (2015) PacBio sequencing and its applications. Genomics, proteomics &bioinformatics 13 : 278-289.
Ronaghi, M. (2001) Pyrosequencing sheds light on DNA sequencing. Genome research 11 : 3-11.
Sanger, F., Nicklen, S., and Coulson, A.R. (1977) DNA sequencing with chain-terminating inhibitors. Proceedings of the national academy of sciences 74 : 5463-5467.
Sutton, G.G., White, O., Adams, M.D., and Kerlavage, A.R. (1995) TIGR Assembler: A new tool for assembling large shotgun sequencing projects. Genome Science and Technology 1 : 9-19.
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)