高通量测序技术(High-throughput sequencing)又称“下一代”测序技术(Next-generation sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。
根据发展历史、影响力、测序原理和技术不同等,主要有以下几种:大规模平行签名测序(Massively Parallel Signature Sequencing, MPSS)、聚合酶克隆(Polony Sequencing)、454焦磷酸测序(454 pyrosequencing)、Illumina (Solexa) sequencing、ABI SOLiD sequencing、离子半导体测序(Ion semiconductor sequencing)、DNA 纳米球测序 (DNA nanoball sequencing)等。 基因分析仪(即DNA测序仪),采用毛细管电泳技术取代传统的聚丙烯酰胺平板电泳,应用该公司专利的四色荧光染料标记的ddNTP(标记终止物法),因此通过单引物PCR测序反应,生成的PCR产物则是相差1个碱基的3'末端为4种不同荧光染料的单链DNA混合物,使得四种荧光染料的测序PCR产物可在一根毛细管内电泳,从而避免了泳道间迁移率差异的影响,大大提高了测序的精确度。由于分子大小不同,在毛细管电泳中的迁移率也不同,当其通过毛细管读数窗口段时,激光检测器窗口中的CCD(charge-coupled device)摄影机检测器就可对荧光分子逐个进行检测,激发的荧光经光栅分光,以区分代表不同碱基信息的不同颜色的荧光,并在CCD摄影机上同步成像,分析软件可自动将不同荧光转变为DNA序列,从而达到DNA测序的目的。分析结果能以凝胶电泳图谱、荧光吸收峰图或碱基排列顺序等多种形式输出。
它是一台能自动灌胶、自动进样、自动数据收集分析等全自动电脑控制的测定DNA片段的碱基顺序或大小和定量的高档精密仪器。PE公司还提供凝胶高分子聚合物,包括DNA测序胶(POP 6)和GeneScan胶(POP 4)。这些凝胶颗粒孔径均一,避免了配胶条件不一致对测序精度的影响。它主要由毛细管电泳装置、Macintosh电脑、彩色打印机和电泳等附件组成。电脑中则包括资料收集,分析和仪器运行等软件。它使用最新的CCD摄影机检测器,使DNA测序缩短至2.5h,PCR片段大小分析和定量分析为10~40min。
由于该仪器具有DNA测序,PCR片段大小分析和定量分析等功能,因此可进行DNA测序、杂合子分析、单链构象多态性分析(SSCP)、微卫星序列分析、长片段PCR、RT-PCR(定量PCR)等分析,临床上可除进行常规DNA测序外,还可进行单核苷酸多态性(SNP)分析、基因突变检测、HLA配型、法医学上的亲子和个体鉴定、微生物与病毒的分型与鉴定等。
一、准备工作
1. BigDye测序反应试剂盒 主要试剂是BigDye Mix,内含PE专利四色荧光标记的ddNTP和普通dNTP,AmpliTaq DNA polymerase FS,反应缓冲液等。
2. pGEM-3Zf (+) 双链DNA对照模板 0.2 g/L,试剂盒配套试剂。
3. M13(-21)引物 TGTAAAACGACGGCCAGT,3.2 μmol/L,即3.2 pmol/μl,试剂盒配套试剂。
4. DNA测序模板 可以是PCR产物、单链DNA和质粒DNA等。模板浓度应调整在PCR反应时取量1 μl为宜。本实验测定的质粒DNA,浓度为0.2 g/L,即200 ng/μl。
5. 引物需根据所要测定的DNA片段设计正向或反向引物,配制成3.2 μmol/L,即3.2 pmol/μl。如重组质粒中含通用引物序列也可用通用引物,如M13(-21)引物,T7引物等。
6. 灭菌去离子水或三蒸水。
7. 0.2 ml或和0.5 ml的PCR管 盖体分离。
8. 3 mol/L 醋酸钠(pH5.2) 称取40.8 g NaAc·3H2O溶于70 ml蒸馏水中,冰醋酸调pH至5.2,定容至100 ml,高压灭菌后分装。
9. 70%乙醇和无水乙醇。
10. NaAc/乙醇混合液 取37.5 ml无水乙醇和2.5 ml 3 mol/L NaAc混匀,室温可保存1年。
11. POP 6测序胶 。
12. 模板抑制试剂(TSR) 。
13. 10×电泳缓冲液 。
14. 全自动DNA测序仪。
15. PCR仪。
16. 台式冷冻高速离心机。
17. 台式高速离心机或袖珍离心机。
二、PCR测序反应
1. 取0.2 ml的PCR管,用记号笔编号,将管插在颗粒冰中,按下表加试剂:
所加试剂 测定模板管 标准对照管
BigDye Mix 1 μl 1 μl
待测的质粒DNA 1 μl -
pGEM-3Zf (+) 双链DNA - 1 μl
待测DNA的正向引物 1 μl -
M13(-21)引物 - 1 μl
灭菌去离子水 2 μl 2 μl
总反应体积5 μl,不加轻矿物油或石蜡油,盖紧PCR管,用手指d管混匀,稍离心。
2. 将PCR管置于9600或2400型PCR仪上进行扩增。98℃变性2 min后进行PCR循环,PCR循环参数为96℃ 10 s,50℃ 5 s,60℃4 min,25个循环,扩增结束后设置4℃保温。
三、醋酸钠/乙醇法纯化PCR产物
1. 将混合物离心,将扩增产物转移到1.5 ml EP管中。
2. 加入25 μl醋酸钠/乙醇混合液,充分振荡,置冰上10 min以沉淀DNA。12 000 r/min于4℃离心30 min,小心弃上清。
3. 加70%(V/V)的乙醇50 μl洗涤沉淀2次。12 000 r/min于4℃离心5 min,小心弃上清和管壁的液珠,真空干燥沉淀10~15 min。
四、电泳前测序PCR产物的处理
1. 加入12 μl的TSR于离心管中,剧烈振荡,让其充分溶解DNA沉淀,稍离心。
2. 将溶液转移至盖体分离的0.2 ml PCR管中,稍离心。
3. 在PCR仪上进行热变性(95℃ 2 min),冰中骤冷,待上机。
五、上机 *** 作 1. 按仪器 *** 作说明书安装毛细管,进行毛细管位置的校正,人工手动灌胶和建立运行的测序顺序文件。2. 仪器将自动灌胶至毛细管,1.2 kV预电泳5 min,按编程次序自动进样,再预电泳(1.2 kV,20 min),在7.5 kV下电泳2 h。3. 电泳结束后仪器会自动清洗,灌胶,进下一样品,预电泳和电泳。4. 每一个样品电泳总时间为2.5 h。5. 电泳结束后仪器会自动分析或打印出彩色测序图谱。
六、序列分析 仪器将自动进行序列分析,并可根据用户要求进行序列比较。如测序序列已知,可通过序列比较以星号标出差异碱基处,提高工作效率。
七、仪器清洗 测序完毕按仪器 *** 作规程进行仪器清洗与保养。
八、计算
1. 测序反应精确度计算公式:100%-差异碱基数(不包括N数)/650×100%。
2. 差异碱基即测定的DNA序列与已知标准DNA序列比较不同的碱基,N为仪器不能辨读的碱基。 SILVER SEQUENCETM DNA测序系统是一种无放射性的序列分析系统,它通过灵敏的银染方法检测凝胶中的条带。 银染提供了一种对于放射性或荧光法来说更加快速,廉价的替代方法。测序结果可以在同一天内得到;电泳完成后经90分钟就可读序,这是常规的放射性测序法做不到的。 此外,SILVER SEQUENCETM系统用未修饰的5'OH寡聚核苷酸作为引物,减少了特殊修饰寡聚核苷酸的花费。该系统不需要放射性方法中对同位素的谨慎 *** 作,也不需要荧光法或化学发光技术的昂贵试剂。另外,也不需要象大多数荧光法那样用仪器来检测序列条带。
Taq DNA聚合酶在95℃时极强的热稳定性。本系统利用的测序级Taq DNA聚合酶是一种Taq DNA聚合酶的修饰产品,对于双链DNA模板有非常好的效果,具有高度的准确性,能产生均一的条带,且背景低。
SILVER SEQUENCETM系统包含被修饰的核苷酸混合物,如7-去氮dGTP(7-deaza dGTP,或dITP)替代dGTP可清除由GC丰富区域所引起的条带压缩现象。
退火温度是热循环测序中最重要的因素。高退火温度可减少模板二级结构。提高引物结合模板配对的严谨性。链重退火和模板二级结构则限制了小片断PCR产物(<500bp)得到清楚的序列数据的能力。引物延伸起始于每个循环的退火阶段。在较低温度时,聚合酶可能会遇到坚固的二级结构区域,它可导致聚合酶解离。则在四个电泳道中均有同一相对位置的条带。因为这些原因,应该使用尽可能高的退火温度。对于有牢固二级结构的模板建议使用95℃变性、70℃退火/延伸的循环模式。一般来说,较长的引物及GC含量高的引物能得到较强的信号。实验结果表明,>24mer的GC含量约为50%的引物可得到最佳结果。
由于本系统采用热循环装置, 与常规的测序方法相比具有如下几点好处:(1).本方法线性扩增模板DNA产生足够的产物使银染技术能够检测序列条带,测序反应需要0.03~2pmol模板DNA,随模板种类而定。(2). 在每一个变性循环中的高温可以取代对双链DNA(dsDNA)模板的碱变性及乙醇沉淀过程,变性循环也有助于消除由于线性dsDNA模板(如PCR反应产物)快速重退火所引起的问题。(3). 高温聚合酶反应减弱了DNA模板的二级结构,允许聚合酶穿过高度二级结构化的区域。
一、试剂准备
1. SILVER SEQUENCETM DNA测序试剂盒。
2. 丙烯酰胺和甲叉双丙烯酰胺储备液(38%丙烯酰胺 W/V,2%甲叉双丙烯酰胺 W/V):95 g丙烯酰胺,5 g甲叉双丙烯酰胺溶于140 ml 双蒸水中,定容至250 ml,0.45 mm过滤器过滤后,贮于棕色瓶中,置于4℃冰箱可保存2周。
3. 10%过硫酸铵,0.5 g过硫酸铵溶于4 ml水中,定容至5 ml,应新配新用。
4. 10×TBE缓冲液(1 mol/L Tris, 0.83mol/L 硼酸,10 mmol/L EDTA): 121.1 g Tris,51.35 g硼酸,3.72 g Na2EDTA ·2H2O,溶于双蒸水中定容至1升,置于4℃下可贮存2周,其pH约为8.3。
5. TBE电极缓冲液:10×TBE 缓冲液稀释至1×TBE备用。
6. TEMED
7. 固定/停止溶液:10%冰醋酸(V/V)配制2升备用。
8. 染色溶液:硝酸银2 g,甲醛3 ml,溶于2升超纯水中备用。
9. 显影溶液:60 g碳酸钠(Na2CO3)溶于2升超纯水中,使用前加3 ml 37%甲醛和40 ml硫代硫酸钠溶液(10 mg/ml)。
10. 95%乙醇。
11. 0.5%冰乙酸。
12. Sigmacote (Sigma CAT. #SL-2)。
二、测序反应
1. 对于每组测序反应,标记四个0.5 ml eppendorf管(G、A、T、C)。每管加入2 ml适当的d/ddNTP混合物(d/ddNTP Mix)。各加入1滴(约20 μl)矿物油,盖上盖子保存于冰上或4℃备用。
2. 对于每组四个测序反应,在一个eppendorf管中混合以下试剂:
(1) 样品反应:
质粒模板DNA :2.1 pmol
5×测序缓冲液 : 5 ml
引物: 4.5 pmol
无菌ddH2O 至终体积16 ml
(2)对照反应
pGEM-3Zf(+)对照DNA(4 mg) :4.0 ml
5×测序缓冲液: 5 ml
pUC/M13正向引物(4.5 pmol) :3.6 ml
3. 在引物/模板混合物(以上第2步)中加入1.0 ml测序级Taq DNA聚合酶(5 μ/ml)。用吸液器吸动几次混匀。
4. 从第3步的酶/引物/模板混合物中吸取4 ml加入每一个d/ddNTP混合物的管内。
5. 在微量离心机中离心一下,使所有的溶液位于eppendorf管底部。
6. 把反应管放入预热至95℃的热循环仪,以【注意】中循环模式为基准,开始循环程序。对于每个引物/模板组合都必须选择最佳退火温度。下列程序一般能读出从引物开始350碱基的长度。
7. 热循环程序完成后,在每个小管内加入3 μlDNA测序终止溶液,在微量离心机中略一旋转,终止反应。
【注意】
(1)测序所用模板DNA的量一般按下面要求加入:
模板种类/长度 模板量
200 bp(PCR产物):16 ng(120 fmol)
3000~5 000 bp(超螺旋质粒DNA): 4 mg(2 pmol)
48 000 bp(λ,粘粒DNA): 1 mg(31 fmol)
由于超螺旋质粒产生的信号比松弛的线性双链DNA弱,因此使用超螺旋质粒作为模板时其用量要比其它模板大一些。
(2)计算与4.5 pmol相当的引物纳克数可用以下一般公式:
4.5 pmol=1.5 ng×n,其中n为引物碱基数
计算与1p mol相当的引物微克数可用以下一般公式:
dsDNA:1 pmol=(6.6×10mg)×n,其中n为模板碱基对数
ssDNA:1pmol=(3.3×10mg)×n,其中n为模板碱基数
(3)为阻止Taq DNA聚合酶延伸非特异性退火引物, 热循环仪必须预热至95℃。温度变换应越快越好。下面的循环时间不包括变温时间。如果你无法确定使用何种模式,建议从模式1开始。
模式1:适用于引物<24碱基或GC含量<50%
95℃ 2分钟,然后: 95℃ 30秒(变性),42℃ 30秒(退火),70℃ 1分钟(延伸)。
模式2:适用于≥24碱基或略短的GC含量≥50%的引物。
95℃ 2分钟,然后:95℃ 30秒(变性),70℃ 30秒(退火/延伸)。
(4)在加入终止溶液之后样品可在4℃保存过夜。
三、测序凝胶板的制备
1. 玻璃板的处理
银染测序的玻璃板一定要非常清洁,一般先用温水和去污剂洗涤,再用去离子水冲洗玻璃板,除去残留的去污剂,最后用乙醇清洗玻璃板。玻璃板上遗留的去污剂微膜可能导致凝胶染色时背景偏高(棕色)。短玻璃板经粘合溶液处理可将凝胶化学交联于玻璃板上。这一步对于在银染 *** 作过程中防止凝胶撕裂至关重要。
(1)短玻璃板的处理
① 在1 ml95%乙醇,0.5%冰乙酸中加入5 ml粘合硅烷(Bind Silane),配成新鲜的粘合溶液。
② 用经浸透新配的粘合溶液浸透的吸水棉纸擦拭仔细清洗过并已经自然干燥的玻璃板,整个板面都必须擦拭。
③ 4~5分钟后,用95%乙醇单向擦玻璃板,然后略用力沿垂直方向擦拭。重复三次这一清洗过程,每次均须换用干净的纸,除去多余的粘合溶液。
【注意】
① 在95%乙醇单向擦玻璃板时过度用力会带走过多的粘合硅烷,使凝胶不能很好地粘附。
② 准备长玻璃板之前要更换手套,防止粘染粘合硅烷。
③ 防止粘合溶液沾染在长玻璃板上是很重要的,否则将导致凝胶撕裂。
(2)长玻璃板的处理:
① 用浸透Sigmacote溶液的棉纸擦拭清洗过的长玻璃板。
② 5~10分钟后用吸水棉纸擦拭玻璃板以除去多余的Sigmacote溶液。
【注意】
① 用过的凝胶可在水中浸泡后用剃须刀片或塑料刮刀刮去。玻璃板须用去污剂完全清洗。或者凝胶用10%NaOH浸泡后除去。为防止交叉污染,用于清洗短玻璃板的工具必须与清洗长玻璃板的工具分开,如果出现交叉污染,以后制备的凝胶可能撕裂或变得松弛。
2. 凝胶的制备
(1)玻璃板经粘合硅胶和Sigmacote处理后,即可固定玻璃板。该方法是用0.2 mm或0.4 mm厚的边条置于玻璃板左右两侧,将另一块玻璃板压于其上。在长玻璃板的一侧插入鲨鱼齿梳平的一面边缘,用夹子固定住。
(2)根据所需要的凝胶浓度,按下表制备测序凝胶,一般6%~8%的胶浓度可获得较好的结果。配制过程中,先用适量双蒸水溶解尿素,再加入Acr&Bis和10×TBE缓冲液,再用双蒸水调终体积至99.2 ml,并用0.45 mm的滤膜过滤,然后加过硫酸铵和TEMED。溶解尿素时不必加热。如果确需加热则应等溶液完全冷却后,方可加入TEMED和过硫酸铵。一般在胶灌制后4~6分钟,即开始聚合,如果聚合不好,则应使用高浓度的TEMED和过硫酸铵。
(3)胶配制好后,即可灌制胶板。一般是将凝胶沿着压条边缘缓慢地倒入玻璃板的槽中,倒完后,静止放置使之聚合完全。
【注意】
① 使用夹子固定玻璃板时,最好夹子的力量稍大一些,防止因力量不足使灌胶的过程中出现漏胶液现象。
② 灌制凝胶的过程中要严防产生气泡,否则影响测序的结果。
四、电泳
1. 预电泳
(1)当凝胶聚合完全后,拨出鲨鱼齿梳,将该梳子反过来,把有齿的一头插入凝胶中,形成加样孔。
(2)立即将胶板固定在测序凝胶槽中,一般测序凝胶槽的上下槽是分开的,因而只有在固定好凝胶板后,方能加入TBE缓冲液。
(3)稀释10×TBE缓冲液至1×TBE,将该缓冲液加入上下二个电泳槽中,去除产生的气泡,接上电源准备预电泳。
(4)有些电泳槽,如LKB的Macrophor等是使用水浴加热的,则应先将水浴加热至55℃后进行预电泳。有的不使用水浴加热,依靠电泳过程中自身产生的热进行保温,如上海求精有机玻璃仪器生产的测序电泳槽,这种槽需夹上二块散热铝板,使整个凝胶板的温度一致。
(5)按30 V/cm的电压预电泳20~30分钟。预电泳的过程是去除凝胶的杂质离子,同时使凝胶板达到所需的温度。高温电泳可防止GC丰富区形成的发夹状结构,影响测序的结果。
【注意】
① 用鲨鱼齿梳制作加样孔时,应注意将齿尖插入胶中0.5mm左右,千万注意不能使加样孔渗漏,否则得不到正确的结果。
② 应时刻注意上面电泳槽中的缓冲液是否渗漏,否则极易造成短路而损坏电泳仪。
2. 样品的制备
当在预电泳时,即可进行样品的制备,将反应完毕的样品在沸水浴中加热1~3分钟,立即置于冰上即可。如果样品长时间不用,则应重新处理。可使用4~6%聚丙烯酰胺凝胶,胶厚0.4 mm。厚度小于0.4 mm的胶可能导致信号太弱。加样时不必吸去上层覆盖的矿物油,但要小心地吸取矿物油下的蓝色样品。
3. 上样及电泳
关闭电泳仪,用移液q吸缓冲液清洗样品孔,去除在预电泳时扩散出来的尿素,然后立即用毛细管进样器吸取样品,加入样品孔中。上样顺序一般为G、A、T、C。加样完毕后,立即电泳。开始可用30 V/cm进行电泳,5分钟后可提高至40~60 V/cm,并保持恒压状态。一般来说,一个55 cm长,0.2 mm厚的凝胶板,在2500 V恒压状态下电泳2小时即可走到底部,同时在电泳过程中,电流可稳定地从28 mA降至25 mA。为了能读到更长的序列,可采用两轮或多轮上样。
【注意】
① 上样电泳时,一定要注意凝胶板的温度是否达到55℃左右,如果还没有达到,则应等温度达到后才能上样电泳。
② 一般来说电泳时,不宜使用太高的电压,因为太高的电压会使凝胶的分辨率降低,并且使带扩散。电泳中可进行恒功率电泳。
五、测序凝胶的银染
染色过程要求凝胶浸在塑料盘中。因而至少使用两个盘子,大小与玻璃板类似。在盘中加入新鲜溶液之前须用高质量的水洗涤盘子。
1. 电泳完毕后用一个塑料片子小心地分开两板,凝胶应该牢固地附着在短玻璃板上。
2. 固定凝胶:将凝胶(连玻璃板)放入塑料盘,用固定/停止溶液浸没,充分振荡20分钟或直至样品中染料完全消失,胶可在固定/停止溶液中保存过夜(不振荡)。保留固定/停止溶液,用于终止显影反应。
3. 洗胶:用超纯水振荡洗胶3次,每次2分钟。从水中取出,当转移至下一溶液时拿着胶板边沿静止10~20秒,使水流尽。
4. 凝胶染色:把凝胶移至染色溶液充分摇动30分钟。
5. 凝胶显影
(1)在显影溶液中加入甲醛(3 ml)和硫代硫酸钠溶液(400 μl)以完成显影液的配制。
(2)从染色溶液中取出凝胶放入装有超纯水的盘中浸洗5~10秒。注意,把凝胶从超纯水转移到显影溶液的总时间不能长于5~10秒。浸泡时间过长则导致信号微弱或丧失信号。若浸泡时间过长,可重复第五步用染色液浸泡。
(3)立刻将凝胶转移至1升(总量的一半)预冷的显影液充分振荡直至模板带开始显现或开始出现第一批条带,把凝胶移入剩下的1升显影液中继续显影2~3分钟或直至所有条带出现。
6. 固定凝胶:在显影液中直接加入等体积的固定/停止溶液。停止显影反应,固定凝胶。
7. 在超纯水中浸洗凝胶两次,每次2分钟,注意在本 *** 作中戴手套拿着胶板边缘避免在胶上印上指纹。
8. 将凝胶置于室温干燥或用抽气加热法干燥。在可见光灯箱或亮白,黄色背景(如纸)上观察凝胶,若需永久保存的记录, 则可用EDF胶片保留实验结果。
【注意】
测序产物的银染是显现序列信息的一种新方法,本系统的成败受几个因素的影响
① 水的质量对于染色的成功极其重要。超纯水(NANOpureR或Milli-QR的水)或双蒸水可获得较好的效果,如果水中有杂质,则低分子量条带可能无法出现。
② 碳酸钠也非常重要。使用新鲜的,美国化学学会级碳酸钠较好,如Fisher和Kodak ACS试剂级碳酸钠(Fisher Cat #S263-500或S262-3,或Kodak Cat #109-1990),一般可获得较好的结果。
③ 色后的洗涤步骤是非常关键的。如果凝胶洗涤时间太长,银颗粒会脱离DNA,产生很少或没有序列信号。如果洗涤时间过长,染色步骤可以重新进行。
④ 如果凝胶厚度超过0.4 mm或丙烯酰胺浓度高于4~6%,则有必要延长固定和染色的时间。如果凝胶比0.4 mm薄,染色反应后的洗涤必须缩短至不超过5秒。
⑤ 在室温下进行所有步骤,显影反应除外。显影溶液必须预冷至10~12℃以减小背景杂色。注意:临用前在显影溶液中加入甲醛和硫代硫酸钠。用新配的染色及显影溶液。不要重复使用任何溶液。
六、EDF胶片显影
使用EDF胶片可增强测序条带的对比度,如果测序胶上条带很淡,我们建议把数据转移至EDF胶片,银染胶在其影像转移至EDF胶片之后可增强条带可读性。
1. 在暗室内,将染色过的粘于玻璃板的凝胶(胶面向上)置于荧光灯箱上。如有合适的漫射板,亦可用白灯箱,为确保曝光时间,用一小条EDF胶片曝光不同时间,检查不同的曝光强度,一般曝光20~40秒可得较好结果。
2. 在红灯下找到EDF胶片有缺刻的一角,然后把胶片置于凝胶上,使缺口位于左上角。由于EDF胶片是单面的,因此必须确保缺口在左上角。
3. 在EDF胶片上放置一干净、干燥的玻璃板,开亮灯箱约20秒。
4. 用冲显放射自显影胶片的步骤手工显影EDF胶片,可使用下列 *** 作过程:
(1) 在Kodak GBX显影液中显影1~5分钟;
(2) 水洗1分钟;
(3)在Kodak GBX定影液中定影3分钟;
(4)水洗1分钟。
【注意】
① 进行EDF胶片显影之前凝胶必须完全干燥。戴手套进行 *** 作,以免印上指纹。同时注意EDF胶片不能用自动胶片处理器。
② 对于不同的光源最佳曝光时间可能不同,通过对一小条EDF胶片曝光不同时间以选择你所用光源的最佳曝光时间,参阅胶片说明书。
③ 曝光时间短则EDF胶片影像较深,曝光时间长则有助于减弱背景。 “鸟q法”是一种由生物基因组提取目的基因的方法。首先利用物理方法(如剪切力、超声波等)或酶化学方法(如限制性内切核酸酶)将生物细胞染色体DNA切割成为基因水平的许多片段,继而将这些片段与适当的载体结合,将重组DNA转入受体菌扩增,获得无性繁殖的基因文库,再结合筛选方法,从众多的转化子菌株中选出含有某一基因的菌株,从中将重组的DNA分离、回收。
这种方法也就是应用基因工程技术分离目的基因,其特点是绕过直接分离基因的难关,在基因组DNA文库中筛选出目的基因。可以说这是利用“溜散d射击”原理去“命中”某个基因。由于目的基因在整个基因组中太少太小,在相当程度上还得靠“碰运气”,所以人们称这个方法为“鸟q法”或“散dq”实验法。
一、用限制酶切下目的片段的大片段InsertDNA,并用Agarose凝胶电泳进行回收。
二、对回收的大片段DNA用物理方法(如超声波等)进行切断处理,然后用T4DNAPolymerase对小片段DNA进行末端平滑化。
三、进行Agarose电泳,切胶回收1kbp~2kbp的小片段DNA。然后用BcaBestDNAPolymerase在DNA的3'端加上一个A碱基。
四、把加上A-tail的DNA片段连入T-Vector中,然后转化,挑选克隆。
五、对阳性克隆(含1kbp~2kbpInsert)进行DNA测序。
六、对数据进行编辑,最后连成一条大片段的DNA序列。
1977年,英国化学家桑格(Frederick Sanger)发明了双脱氧链终止法,这个技术以及吉尔伯特(W.Gilbert)发明的化学降解法被称为一代测序技术。 Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核苷酸为止。每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。
不同于一代测序,NGS采用的是边合成边测序的策略,主要的技术路线以Roche公司的454技术、illumina公司的Solexa,Hiseq技术和ABI公司的Solid技术为代表。为了增强测序准确性,需要对同一模板通过PCR扩增多个拷贝来矫正偏差值。因此整个测序分为PCR扩增(一种可以快速复制大量产生相同DNA片段的技术)和测序两个步骤。但是PCR过程会一定程度增加系统的错误率,并且带来的错误具有偏向性,这也是二代技术存在的问题之一。
illumina公司主打产品MiSeq测序仪、HiSeq X Ten测序仪、Miseq FGx测序仪、NextSeq 500/550桌上型测序仪、MiniSeq台式测序仪等,涵盖了不同的应用场景的不同需求。
第二代测序技术测序平台和测序成本,测序费用,花费时间,建库等实验技术难度,错误率以及读长(150-400bp),分析工作的体量,对于满足更高的科研需求和在医疗诊断中的普及都是不小的阻碍。其PCR过程带来的误差和偏好或成为其在医疗诊断大规模运用的阻碍。三代技术主要解决二代测长较短的问题。
PacBio 的SMRT 技术,LifeTechnologies 的 IonTorrent 半导体测序技术和 Oxford NanoporeTechnologies 纳米孔单分子测序技术是三代测序技术的代表。
PacBio SMR
PacBio的SMRT仍然运用边合成边测序的策略,但是其超强活性的DNA聚合酶是实现超长读长(~1000bp)的关键。反应在纳米管中进行,方便达到超高通量的目的。利用的是ZMW(零模波导孔)原理在超小的纳米孔中区别荧光信号的背景。其测序速度很快,每秒约10个dNTP。目前的问题在于测序的错误率太高(81-83%),这也是大多数三代技术需要解决的共同问题。不过错误随机,几乎没有偏向性,为其通过矫正来减少错误率提供了可能。目前这个技术已经投入市场。
Oxford Nanopre MinlON
而Nanopore的MinlON测序仪应用纳米孔单分子技术,这是一种基于电信号的测序技术,比起其他的光信号测序技术来说是一个革新。技术核心是一种特殊的内有分子接头的纳米孔,由蛋白质小孔嵌在人造膜上形成。膜两侧加上电压,使电流通过小孔。当不同的DNA碱基通过纳米孔时,其对电流的阻碍作用短暂地影响流过纳米孔的电流强度,不同碱基影响的程度不同,这种差异被灵敏的电子设备捕捉从而鉴定所通过的碱基种类。这种技术的优点很多,读长长(大约在几十kb,甚至100 kb),错误随机,而不是聚集在读取的两端,通量较高,该公司也在努力简化样品制备流程。理论上运用这个技术RNA也可以直接测序,还能检测到甲基化的胞嘧啶。不过不能实现理想的错误率控制,或成为其投入市场的阻碍。
LifeTechnologies IonTorrent
IonTorrent 使用半导体芯片,在芯片的微孔中固定DNA链。依次加入AGCT的碱基,DNA合成时如果碱基可以结合到模板链则会释放一个氢离子。这个氢离子导致局部HP值发生变化。离子传感器检测到PH 变化后,便将化学信号转变为序列信息。而如果DNA 链有两个连续的相同碱基,则记录到的信号翻倍,从而将其识别。如果不匹配,则记录不到变化。这种技术由于不涉及荧光激发和拍照,则运行时间被大大缩减(仅数小时),无需激光光源,光学系统和照相系统,也不需要荧光标记,规避了这些环节带来的误差。但是其读长不算太长(200bp),并且当遭遇多个连续的相同碱基时,强烈的PH变化会带来误差。
de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。
外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel等具有较大的优势,但无法研究基因组结构变异如染色体断裂重组等。
Magenomics研究的对象是整个微生物群落。相对于传统单个细菌研究来说,它具有众多优势,其中很重要的两点:(1)微生物通常是以群落方式共生于某一小生境中,它们的很多特性是基于整个群落环境及个体间的相互影响的,因此做Metagenomics研究比做单个个体的研究更能发现其特性;(2) Metagenomics研究无需分离单个细菌,可以研究那些不能被实验室分离培养的微生物。
单核苷酸多态性singlenucleotide polymorphism,SNP 或单核苷酸位点变异SNV。个体间基因组DNA序列同一位置单个核苷酸变异(替代、插入或缺失)所引起的多态性。不同物种、个体基因组DNA序列同一位置上的单个核苷酸存在差别的现象。有这种差别的基因座、DNA序列等可作为基因组作图的标志。人基因组上平均约每1000个核苷酸即可能出现1个单核苷酸多态性的变化,其中有些单核苷酸多态性可能与疾病有关,但可能大多数与疾病无关。单核苷酸多态性是研究人类家族和动植物品系遗传变异的重要依据。在研究癌症基因组变异时,相对于正常组织,癌症中特异的单核苷酸变异是一种体细胞突变,称做SNV。
基因组上小片段(<50bp)的插入或缺失,形同SNP/SNV。
当基因组发生某一段的缺失,或转录组的剪接,在测序过程中,横跨缺失位点及剪接位点的reads回帖到基因组时,一条reads被切成两段,匹配到不同的区域,这样的reads叫做soft-clipped reads,这些reads对于鉴定染色体结构变异及外源序列整合具有重要作用。
由于大部分测序得到的reads较短,一个reads能够匹配到基因组多个位置,无法区分其真实来源的位置。一些工具根据统计模型,如将这类reads分配给reads较多的区域。
拼接软件基于reads之间的overlap区,拼接获得的序列称为Contig(重叠群)。
基因组de novo测序,通过reads拼接获得Contigs后,往往还需要构建454 Paired-end库或Illumina Mate-pair库,以获得一定大小片段(如3Kb、6Kb、10Kb、20Kb)两端的序列。基于这些序列,可以确定一些Contig之间的顺序关系,这些先后顺序已知的Contigs组成Scaffold。
Reads拼接后会获得一些不同长度的Contigs。将所有的Contig长度相加,能获得一个Contig总长度。然后将所有的Contigs按照从长到短进行排序,如获得Contig 1,Contig 2,Contig 3...…Contig 25。将Contig按照这个顺序依次相加,当相加的长度达到Contig总长度的一半时,最后一个加上的Contig长度即为Contig N50。举例:Contig 1+Contig 2+ Contig 3+Contig 4=Contig总长度*1/2时,Contig 4的长度即为Contig N50。Contig N50可以作为基因组拼接的结果好坏的一个判断标准。
Scaffold N50与Contig N50的定义类似。Contigs拼接组装获得一些不同长度的Scaffolds。将所有的Scaffold长度相加,能获得一个Scaffold总长度。然后将所有的Scaffolds按照从长到短进行排序,如获得Scaffold 1,Scaffold 2,Scaffold 3...……Scaffold 25。将Scaffold按照这个顺序依次相加,当相加的长度达到Scaffold总长度的一半时,最后一个加上的Scaffold长度即为Scaffold N50。举例:Scaffold 1+Scaffold 2+ Scaffold 3 +Scaffold 4 +Scaffold 5=Scaffold总长度*1/2时,Scaffold 5的长度即为Scaffold N50。Scaffold N50可以作为基因组拼接的结果好坏的一个判断标准。
测序深度是指测序得到的总碱基数与待测基因组大小的比值。假设一个基因大小为2M,测序深度为10X,那么获得的总数据量为20M。覆盖度是指测序获得的序列占整个基因组的比例。由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖有所的区域,这部分没有获得的区域就称为Gap。例如一个细菌基因组测序,覆盖度是98%,那么还有2%的序列区域是没有通过测序获得的。
用测序的数据组装成转录本。有两种组装方式:1,de-novo构建; 2,有参考基因组重构。其中de-novo组装是指在不依赖参考基因组的情况下,将有overlap的reads连接成一个更长的序列,经过不断的延伸,拼成一个个的contig及scaffold。常用工具包括velvet,trans-ABYSS,Trinity等。有参考基因组重构,是指先将read回贴到基因组上,然后在基因组通过reads覆盖度,junction位点的信息等得到转录本,常用工具包括scripture、cufflinks。
比较基因组学(ComparativeGenomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构
Q30是指一个碱基的识别可靠性等于99.9%,或者说出错可能性是0.1%。Q20则是指碱基识别的可靠性等于99%。Q30数据量是指一批数据中,质量高于等于Q30的数据的量的总和。
PF是pass filter的意思。也就是质量合格的意思。Illumina的测仪序会自动地对一个read(序列)的质量可靠性进行打分。对于前25个碱基中的是否有两个碱基的识别可靠性低于0.6,是PF的判断标准。这句话翻译成较容易理解的话: 就是前25个碱基中,如果低质量的数据有2个或更多,则这条read被判定为不合格,PF就不通过。反之,则质检通过。
PF是国际公认的质检标准。对于哺乳动物基因组重测序、外显子测序,我们保证数据质量是Q30的比例高于80%。对于mRNA测序,smRNA测序,我们保证对照Lane的数据质量是Q30的比例高于80%。
一般情况下:
哺乳动物基因组重测序、外显子测序,GC比例在40%左右,Q30的比例是80~95%;
RNA-seq,GC比例在50%左右,Q30的比例是~80%。如果Poly(A)特别多的情况下,Q30会更低一些;
SmRNA-seq,因为有许多的read读通之后,只剩下一串的A,质量会更低,我们的实验结果%Q30在70~75%。
Illumina的测序仪的数据产量高,数据质量也是最高的。因为采用带终止基团的荧光dNTP,所以在测Homopolyer(碱基同聚物,例如一串4个T:TTTT)等的时候,不会产生移码错读。
Roche 454采用的是pyrosequencing的测序原理,通过水解DNA全成过程中所产生的焦磷,放出光,通过测这光来读出序列。优点是读长最长。但是数据产量是最低的。
Ion Torrent,包括PGM和Proton,采用测量DNA合成过程中所释放的氢离子引起的PH值的变化,来得到序列。优点是速度最快,上机前约3~4天的时间,上机只要2~4个小时。
SOLID采用的是杂交,连接反应,再测荧光的方法。因为杂交,所以速度慢,测长较短。现在事实上已被淘汰。
PacBio是三代测序,也就是单分子测序。目前的情况是测序长度可以在1个KB以上,而且可以测出DNA序列的修饰情况。但是其缺点在于测序的准确度很低,目前的测序准确度只有每个碱基80~90%。另一方面通量较小,一次读7万条reads.
部分参考:https://www.jianshu.com/p/acd38ee4b7a1
1977年,英国化学家桑格(Frederick Sanger)发明了双脱氧链终止法,这个技术以及吉尔伯特(W.Gilbert)发明的化学降解法被称为一代测序技术。Sanger曾经在1958年及1980年两度获得诺贝尔化学奖,是第四位两度获得诺贝尔奖,以及唯一获得两次化学奖的人。其第一次获奖是凭借定序胰岛素的氨基酸序列,证明蛋白质具有明确构造,而第二次获奖就是因为其双脱氧链终止法——Sanger法的发明。利用这个技术他成功测定了Φ-X174噬菌体(Phage Φ-X174)的基因组序列。Sanger也是一个传奇的大科学家,现在基因组研究中举足轻重的桑格研究院(Sanger Institute)便是这位大牛一手建立的。
第一代测序技术的特点是测序读长可达1000bp,准确性高达99.999%,但测序成本高,通量低等方面的缺点,严重影响了其真正大规模的应用。但由于高精度,现今一代测序仍然是基因检测的金标准,也是对新一代测序结果进行评估验证的主要手段。而在当时,正是一代测序技术使得基因组的研究在当时成为了可能,浩浩荡荡的人类基因组计划即将轰轰烈烈的展开。1977年,英国化学家桑格(Frederick Sanger)发明了双脱氧链终止法,这个技术以及吉尔伯特(W.Gilbert)发明的化学降解法被称为一代测序技术。Sanger曾经在1958年及1980年两度获得诺贝尔化学奖,是第四位两度获得诺贝尔奖,以及唯一获得两次化学奖的人。其第一次获奖是凭借定序胰岛素的氨基酸序列,证明蛋白质具有明确构造,而第二次获奖就是因为其双脱氧链终止法——Sanger法的发明。利用这个技术他成功测定了Φ-X174噬菌体(Phage Φ-X174)的基因组序列。Sanger也是一个传奇的大科学家,现在基因组研究中举足轻重的桑格研究院(Sanger Institute)便是这位大牛一手建立的。
第一代测序技术的特点是测序读长可达1000bp,准确性高达99.999%,但测序成本高,通量低等方面的缺点,严重影响了其真正大规模的应用。但由于高精度,现今一代测序仍然是基因检测的金标准,也是对新一代测序结果进行评估验证的主要手段。而在当时,正是一代测序技术使得基因组的研究在当时成为了可能,浩浩荡荡的人类基因组计划即将轰轰烈烈的展开。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)