一代测序
首先讲一下测序的基础方法,Sanger测序 (Sanger et al.,1977)
1977年Frederick Sanger和同事发展出双脱氧测序法(dideoxy sequencing method)或称链终止法,并对噬菌体phiX-174测序以来,测序原理并未有太多变化。后来测序方法的改革也几乎都是在此基础上,缩短时间,降低人力,比如①在每一种ddNTP中掺入不同的荧光标记,使测序在单一反应中就能进行。②使用极薄极长的充胶玻璃毛细管代替大的聚丙烯酰胺凝胶块,新的介质散热更快,使电泳能在高压下进行,降低分离时间等诸如此类的减少分离时间的变革。③更换探查单一核苷酸的方法,用微转换器控制通过的电流检测核苷酸等等。
Sanger法测序需要引物,DNA聚合酶,脱氧核糖核苷三磷酸(dNTPs),有限量的双脱氧核苷三磷酸(ddNTPs)。按照碱基配对原则,dNTPs在引物之后按照模板延伸,ddNTPs的随机加入会由于它缺乏连接下一个的3’羟基而导致反应终止,由于ddNTPs的结合位置随机,我们会得到一系列大小不同的片段,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或同位素标记进行检测。也正是这个原理,所以测序得到较长的序列的概率低,长序列往往需要双向测序再进行拼接。
Maxam gilbert 化学法测序 (Maxam and Gilbert,1977)
几乎同时,Maxam和Gilbert发明了化学链降解法测序。
通过化学终止反应测序。首先双链变单链,准备工作完成。采用特定的化学试剂来从DNA链上断裂特定碱基,在5’端磷酸化(32P),四种化学反应:G反应,A+G反应,T+C反应,C反应,分别进行并产生一系列片段。然后进行电泳(electrophoresis),放射自显影(radioautography),最后可以整理得到序列。
二代测序(目前拥有这些测序仪的公司主要有Illumina,Thermo Fisher Scientific(已收购life,ABI, Ion torrent公司,所以在TFS官网可以找到这些测序仪),Roche)
一些和前后都没有紧密联系的概念
深度测序(deep sequencing)不是什么测序方法,而是根据对目的基因测序的depth和coverage(C)对测序方法的归类。如果这个片段被测序了大于7次(coverage>7),那么基本可以说是深度测序,大于100×称为ultra deep sequencing。还有一些概念比如length of genome(G)指全基因组长度,number of reads(N)片段数量,average read length(L)。
C=N×(L/G)
pyrosequencing 焦磷酸测序法 (Ronaghi, 2001) -454 二代测序 (Jarvie, 2005)
焦磷酸测序法
它后来发展称为Roche公司454技术所使用的测序方法。
是一种酶联级联测序技术,准确度可与Sanger媲美,且速度大大提高。具备同时对大量样品进行测序分析的能力,为大通量,低成本,快速地进行单核苷酸多态性(single nucle-otide potymorphisms, SNPs)研究提供了理想的技术支持。改进后的焦磷酸测序技术可以满足上百个核苷酸测序。但是测序长度一般在100bp左右,一直用于短序列分析。它的技术原理是4种酶在同一反应体系种级联化学发光反应,引物与模板DNA退火后,在DNA聚合酶,ATP硫酸化酶(ATP sulfurytase),荧光素酶(luciferase)和磷酸酶(Apyrase)协同作用下,检测荧光,实时测定DNA序列。
454测序-固定的焦磷酸测序体系(2016年被Roche公司淘汰)
首先是序列处理:全基因组DNA处理为小的片段(鸟q法处理的),在一端连接两端分别连接A和B(可以在PCR中产生大量的目的序列),然后解链变成带有adaptors的单链DNA,这个adaptorA的序列可以与小珠子上面的短序列B匹配,这样我们要测序的片段就被固定了。小珠子是不可溶的且与酶不反应的分子,作为固定表面。然后进行乳化PCR,得到了满载分子的小珠子并将它们放入小孔。接下来是焦磷酸测序的原理,引物是adaptorA,每次反应加一种dNTP,如果可以碱基配对,会在DNA聚合酶下结合在引物末端,释放一个分子的焦磷酸(PPi)。在ATP硫酸化酶作用下,PPi与APS结合形成ATP,ATP与荧光素在荧光素酶作用下形成氧化荧光素,产生可见光。反应后冲洗掉剩余dNTP和少量ATP。
大多数现代测序方法都是分为这几步,主旨是实现高通量和自动化。①全基因组片段化。②adapter ligation末端连接短序列。③目标DNA与分子小珠子的结合。④将小珠子加载到孔板。⑤采用适合的方法测序。⑥数据处理。
连接酶法测序(Sequencing by ligation) (Albrecht et al.,2000) -ABI 公司SOLID测序 (Hedges et al.,2011)
连接酶测序法
利用的是DNA ligase的一个特性。连接酶是将DNA分子末端连接在一起的酶,它对DNA结构敏感,如果两条链的碱基不匹配,那么酶的效率很低。
具体如下图,模板链连接P1Adaptor,引入引物Pn与探针寡核苷酸混合物,一般8-9bp,前两个是与模板结合的碱基,中间三个为universal配对,后三个也是且5’连接荧光标记。在酶的作用下,正确配对的探针偏向与模板结合,然后荧光信号被检测并切除,露出5’端,继续反应。中间NNN的碱基部分可以通过加入引物Pn-1的方法,进行错位测序,之后整合数据。
ABI公司SOLID测序平台
在前期准备上与454测序相似,也会用到小分子的beads。但是测序方法为连接酶法,不是焦磷酸。
鸟q法(shotgun sequencing) (Sutton et al.,1995) 测序- Ion torrent 公司PGM测序 (Merriman et al.,2012)
鸟q法
传统的sanger法适合短一些的序列,当处理比如人类基因组的长序列时,需要鸟q法将长序列变成短序列。并不是一个独特的测序方法,应该算是前处理技术。这些通过鸟q法处理得到的短序列位点和长度随机,称为contigs(重叠群/连接片段)。然后用不同的测序方法测序,将结果输入电脑,它用算法(algorithm)将contigs的重叠部分进行拼接,得到完整序列。
Ion Torrent公司Proton测序仪
此方法比较快速。测序的原理与其他的不同,检测的不是荧光信号,而是核苷酸结合时释放的氢离子H+。同样全基因组→片段化,单链→连接adaptor→adaptors配对连接beads小分子→乳化PCR amplify。这些步骤与其他二代测序一样,不同的是Ion Torrent采用半导体芯片代替之前的孔板,加载携带序列的小分子在芯片上,芯片由可以承载小分子beads的孔和感受pH的传感器构成,这样前期准备就完成了。测序也是逐个加入四种核苷酸,检测产生的氢原子对溶液pH的影响,收集处理信号。
illumina 公司测序平台目前占据大部分市场,以HiSeq系列为主 (Quail et al., 2008)
特点是很便宜,速度也很快。①前期对基因组的片段化以及两端连接adaptorA,B与其他二代测序技术类似,②不同的是它没有用beads,核心反应容器是可以吸附流动DNA片段的测序流动槽(flowcell),每个flowcell上有8个道(lane),lane上面有与adaptorA,B相互配对的序列,所以可以固定DNA。③桥式PCR扩增与变性。先因为adaptorA,B序列而结合,形成拱桥性状,开始扩增,完成后双链和两端会再变性分开,新产生的单链作为模板再开始桥式反应。最后的结果是会产生一簇正反向的目的片段(详见下图)。④测序,检测荧光信号,整合结果。
第三代测序
PacBio公司的SMRT和OxfordNanopore Technologies纳米孔单分子测序技术被称为第三代测序技术。其特点是不需要进行扩增,就是说小分子beads/桥式PCR的步骤是不需要的,而且产生的reads(读长)较长(>20kb)。
PacBio 公司的SMRT (Rhoads and Au,2015)
这个方法有点在上面提了,且速度快,由于是实时检测,所以还可以检测碱基的表观修饰情况,如甲基化。但是缺点是错误率太高,以缺失序列和错位居多。SMRT芯片为测序载体(如同flowcell),不同碱基用不同荧光标记,在合成配对时检测荧光信号。
实现实时长序列测序的关键第一是采用的DNA聚合酶的活性保持,第二是区分配对的反应信号与周围游离碱基的强大背景荧光,采用零模波导孔原理,在反应管(SMRTCell:单分子实时反应孔)中有许多圆形纳米小孔达到降噪检测的目的。
Oxford Nanopore 的MinION (Mikheyev and Tin,2014)
是基于电信号的测序。它的特点是仪器真的非常小,reads更加长(几十甚至上百kb),而且DNA在测序中不被破坏,但是错误率同样很高。它能够直接读取出甲基化的胞嘧啶,而不必像二代测序方法那样需要事先对基因组进行bisulfite处理,这是因为存在表观修饰的碱基激发的电流强度是不同的。这对于在基因组水平直接研究表观遗传等相关现象有极大的帮助。
技术核心是特殊的纳米孔,孔内共价结合分子接头。当DNA分子通过纳米孔时,它们使电荷发生变化,从而短暂地影响流过纳米孔的电流强度(每种碱基所影响的电流变化幅度是不同的),最后高灵敏度的电子设备检测到这些变化从而鉴定所通过的碱基。
参考文献
Albrecht, G., Brenner, S., Dubridge, R.B., Lloyd, D.H., and Pallas, M.C. (2000) Massively parallel signature sequencing by ligation of encoded adaptors. In: Google Patents.
Hedges, D.J., Guettouche, T., Yang, S., Bademci, G., Diaz, A., Andersen, A. et al. (2011) Comparison of three targeted enrichment strategies on the SOLiD sequencing platform. PloS one 6 .
Jarvie, T. (2005) Next generation sequencing technologies. Drug Discovery Today: Technologies 2 : 255-260.
Maxam, A.M., and Gilbert, W. (1977) A new method for sequencing DNA. Proceedings of the National Academy of Sciences 74 : 560-564.
Merriman, B., D Team, I.T., and Rothberg, J.M. (2012) Progress in ion torrent semiconductor chip based sequencing. Electrophoresis 33 : 3397-3417.
Mikheyev, A.S., and Tin, M.M. (2014) A first look at the Oxford Nanopore MinION sequencer. Molecular ecology resources 14 : 1097-1102.
Quail, M.A., Kozarewa, I., Smith, F., Scally, A., Stephens, P.J., Durbin, R. et al. (2008) A large genome center's improvements to the Illumina sequencing system. Nature methods 5 : 1005.
Rhoads, A., and Au, K.F. (2015) PacBio sequencing and its applications. Genomics, proteomics &bioinformatics 13 : 278-289.
Ronaghi, M. (2001) Pyrosequencing sheds light on DNA sequencing. Genome research 11 : 3-11.
Sanger, F., Nicklen, S., and Coulson, A.R. (1977) DNA sequencing with chain-terminating inhibitors. Proceedings of the national academy of sciences 74 : 5463-5467.
Sutton, G.G., White, O., Adams, M.D., and Kerlavage, A.R. (1995) TIGR Assembler: A new tool for assembling large shotgun sequencing projects. Genome Science and Technology 1 : 9-19.
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)