MicroRNA (miRNA) 是一类由内源基因编码的长度约为22 个核苷酸的非编码单链RNA分子,它们在动植物中参与转录后基因表达调控。到目前为止, 在动植物以及病毒中已经发现有28645个miRNA 分子(Release 21: June 2014) 。大多数miRNA 基因以单拷贝、多拷贝或基因簇(cluster) 的形式存在于基因组中(Lagos2Quintanaet al, 2001;Lau et al,2001) 。
基本介绍 中文名 :MicroRNA 性质 :非编码单链RNA 分子 特点 :由内源基因编码的长度等 缩写 :miRNA 简介,MicroRNA,特征,功能,MicroRNA的过表达,MicroRNA的下调,作用方式,识别方法,siRNA,待解决问题,研究工具,分离,探针制备,检测,功能分析,miRNA展望, 简介 MicroRNA (miRNA) 是一类内生的、长度约为20-24个核苷酸的小RNA,其在细胞内具有多种重要的调节作用。每个miRNA可以有多个靶基因,而几个miRNA也可以调节同一个基因。这种复杂的调节网路既可以通过一个miRNA来调控多个基因的表达,也可以通过几个miRNA的组合来精细调控某个基因的表达。据推测,miRNA调节着人类三分之一的基因。最近的研究表明大约70 %的哺乳动物miRNA 是位于TUs区( transcriptionunits , TUs ) ( Rodriguez et al ,2004) , 且其中大部分是位于内含子区( Kim &Nam , 2006) 。一些内含子miRNA 的位置在不同的物种中是高度保守的。miRNA 不仅在基因位置上保守, 序列上也呈现出高度的同源性(Pasquinelli etal , 2000 ; Ruvkun et al , 2001 ; Lee & Ambros ,2001) 。miRNA 高度的保守性与其功能的重要性有着密切的关系。miRNA 与其靶基因的进化有着密切的联系, 研究其进化历史有助于进一步了解其作用机制和功能。 micro RNA MicroRNA MicroRNA(miRNA)是一类内生的、长度约20-24个核苷酸的小RNA,几个miRNAs也可以调节同一个基因。可以通过几个miRNAs的组合来精细调控某个基因的表达。据推测,miRNA调节着人类三分之一的基因。 MicroRNA存在多种形式,最原始的是pri-miRNA,长度大约为300~1000个碱基;pri-miRNA经过一次加工后,成为pre-miRNA即microRNA前体,长度大约为70~90个碱基;pre-miRNA再经过Dicer酶酶切后,成为长约20~24nt的成熟miRNA。 实际研究中,pre-miRNA套用最早,也最广泛,很多商业化的MicroRNA库都是pre-miRNA形式的。近几年来,研究发现microRNA的双臂对成熟miRNA的形成有着十分重要的作用,所以天然的pri-miRNA形式越来越多地被研究者采用。 MicroRNAs (miRNAs)是一种大小约21—23个碱基的单链小分子RNA,是由具有发夹结构的约70-90个碱基大小的单链RNA前体经过Dicer酶加工后生成,不同于siRNA(双链)但是和siRNA密切相关。据推测,这些非编码小分子RNA(miRNAs)参与调控基因表达,但其机制区别于siRNA介导的mRNA降解。第一个被确认的miRNA是线上虫中首次发现的lin-4 和let-7,随后多个研究小组在包括人类、果蝇、植物等多种生物物种中鉴别出数百个miRNAs。 特征 已经被鉴定的miRNAs据推测大都是由具有发夹结构,约70个碱基大小形成发夹结构的单链RNA前体经过Dicer酶加工后生成的,有5’端磷酸基和3’羟基,大小约21—25nt的小分子RNA片断,定位于RNA前体的3’端或者5’端。 3个研究小组分别从线虫、果蝇和Hela细胞中鉴定的100个新miRNAs中,有15%跨越线虫、果蝇和哺乳动物基因组具有高度的保守性(只有有1—2个碱基的区别)。Lau 和Bartel 实验室的同事更加认为:所有的miRNAs可能在其他物种中具有直向同源物(Ortholog,指那些起源于同一祖先,在不同生物体中行使同一功能的基因群就可比作为一个门类,这些类似的基因被称为“直向同源物”)。 Bantam 最早被认为是果蝇中参与细胞增殖的一个基因位点。已知几个包含增强子的转座子插入跨越这个位点的一段123kb区域会导致果蝇的眼和翅重复生长,而由转座子介导的一段跨越该位点的23kb片断缺失则导致突变果蝇个体小于野生型果蝇。Cohen和同事用一段385kb的片断导入21kb片断缺失的果蝇中使其恢复原来的大小。但是奇怪的是表达这个385kb片断中的EST却没有同样的效果。Cohen将这个片断和疟蚊Anopheles gambiae的同源序列进行比较,发现一段90bp的高度保守区,经过RNA folding program (mfold)发现这个保守序列可以形成发夹结构,使得这个区段很象是一个miRNA的前体。这个结果经过Northern blot证实突变果蝇的幼体缺少一个21bp的bantam miRNA ,用这个90bp的mRNA前体经过一系列的“功能缺失”—“功能恢复”实验,证实 bantam miRNA在细胞增殖中的作用。研究人员用电脑程式检索在hid mRNA的3’非编码区找到了bantam的3个潜在的结合位点( hid是果蝇中一个诱导凋亡的基因),并证实 bantam miRNA抑制hid 的翻译而非转录。 micro RNA miRNAs的表达方式各不相同。部分线虫和果蝇的miRNA在各个发育阶段的全部细胞中都有表达,而其他的miRNA则依据某种更为严谨的位相和时相的表达模式(a more restricted spatial and temporal expression pattern)——在不同组织、不同发育阶段中miRNA的水平有显著差异。 功能 科学家开始认识到这些普遍存在的小分子在真核基因表达调控中有着广泛的作用。线上虫,果蝇,小鼠和人等物种中已经发现的数百个miRNAs中的多数具有和其他参与调控基因表达的分子一样的特征——在不同组织、不同发育阶段中miRNA的水平有显著差异,这种miRNAs表达模式具有分化的位相性和时序性( differential spatial and temporal expression patterns),提示miRNAs有可能作为参与调控基因表达的分子,因而具有重要意义。 第一个被确认的miRNA——线上虫中首次发现的lin-4和let-7,可以通过部分互补结合到目的mRNA靶的3’非编码区(3’UTRs),以一种未知方式诱发蛋白质翻译抑制,进而抑制蛋白质合成,通过调控一组关键mRNAs的翻译从而调控线虫发育进程(reviewed in Pasquinelli 2002)。 bantam miRNA是第一个被发现有原癌基因作用的miRNA。除了lin-4、let-7,已知还有一些miRNAs可能参与在细胞分化和组织发育过程中起重要作用的基因的转录后调控,例如mir-14、mir-23 等。 在植物miRNAs的研究中有两条线索提示miRNAs可能参与植物的发育过程。一是在carpel factory (car) 突变株中3个miRNAs的表达水平显著下降。CARPEL FACTORY 是一个类似Dicer的酶,参与植物的发育,其缺失突变株表现为胚胎和叶片发育的缺陷。实验结果提示这种缺陷是由于缺少miRNAs加工而造成的。多数的植物miRNAs在某些特定组织中高水平表达也提示他们可能参与了植物组织的发育。 对一部分miRNAs的研究分析提示:miRNAs参与生命过程中一系列的重要进程,包括早期发育(Reinhart 2000),细胞增殖,细胞凋亡,细胞死亡(Brennecke 2003),脂肪代谢(Xu 2003)和细胞分化(Kawasaki 2003)。此外,一个研究表明,2个miRNAs水平的下降和慢性淋巴细胞白血病之间的显著相关,提示miRNAs和癌症之间可能有潜在的关系(Calin 2002)。 由于miRNAs存在的广泛性和多样性,提示miRNAs可能有非常广泛多样的生物功能。尽管对miRNA的研究还处于初级阶段,据推测miRNAs在高级真核生物体内对基因表达的调控作用可能和转录因子一样重要。有一种看法是:miRNAs可能代表在一个新发现的层次上的基因表达调控方式。 然而,大多数miRNAs的功能仍然是个谜。 MicroRNA的过表达 MicroRNA存在多种形式,最原始的是pri-miRNA ,长度大约为300-1000个碱基pri-miRNA经过一次加工后,成为pre-miRNA 即microRNA前体,长度大约为70-90个碱基;pre-miRNA再经过Dicer酶酶切后,成为长约20-24nt的成熟miRNA 。实际研究中,pre-miRNA套用最早,也最广泛,目前很多商业化的MicroRNA库都是pre-miRNA形式的。近几年来,研究发现microRNA的双臂对成熟miRNA的形成有着十分重要的作用,所以天然的pri-miRNA形式越来越多地被研究者采用。 MicroRNA的下调 化学合成的miRNA inhibitors ,用于下调目的细胞中的miRNA ,以实现loss-of function研究。 如果您需要进行长期、稳定的miRNA下调,则可以选用载体形式的miRNA inhibitor。其转染效率高,下调效果好,可以实现对目的miRNA的长期、稳定的下调。 载体形式的miRNA inhibitor,采用的方法如miRNA sponge法,这也是目前SCI文献中用的较多的一种方法。 作用方式 microRNA-RISC对靶基因mRNA的作用主要取决于它与靶基因转录体序列互补的程度,有三种方式。 第一种是切断靶基因的mRNA分子——miRNA与靶基因完全互补结合,作用方式和功能与siRNA非常相似,最后切割靶mRNA。在植物中,大部分miRNA都以这种方式,靶基因mRNA断裂后,无poly(A)的分子的3‘ 端加上多个U并很快降解,含poly(A)的分子能稳定存在一段时间(如拟南芥miR-171)。在植物中目前有一个miRNA和3个潜在的目标靶基因完全互补(这些scarecrow 基因编码潜在的转录因子),尽管还不清楚这些基因是否就是miRNA的目标靶,这仍是第一次发现miRNA 和其潜在的目标靶完全互补,也提示miRNA可能包含和siRNA类似的作用方式。 第二种是抑制靶基因的翻译——作用时与靶基因不完全互补结合,进而阻遏翻译而不影响mRNA的稳定性,这种miRNA是目前发现最多的种类(如线虫lin-4)。而在植物中极少数的miRNA通过此方式来抑制靶基因。 第三种是结合抑制——具有以上两种作用模式:当与靶基因互补结合时,直接靶向切割mRNA;当与靶基因不完全结合时,起调节基因表达的作用。 识别方法 多个研究小组采用生物化学结合是生物信息学的方法开展对miRNAs的研究工作。由于据推测都是由Dicer酶降解RNA得到的,21—23个碱基大小、有5’端磷酸基和3’羟基的RNA片断,有的实验室采用改良的定向克隆方法来筛选具有相同特征的小分子——筛选一定大小的RNA分子,连线到3’和5’的适配子(adapters),逆转录并通过PCR扩增、亚克隆并测序。miRNA前体在基因组上的定位和聚类是通过向基因组资料库查询进行。这个方法有助于判断miRNAs是否是mRNAs、tRNAs、rRNAs等分子的降解产物。 有的实验室通过一种RNA folding program ’mfold’ 来判断C elegans 和C briggsae 之间的高度保守区域是否含有潜在的miRNA前体,然后用Northern Blots的方法来确定这些miRNAs是否真的表达了。 尽管有数百个miRNAs通过生化或者是生物信息学的方法被鉴别出来,已经鉴别出来的miRNAs只不过是沧海一粟,由于很多已经鉴别出来的miRNAs是从单个克隆中鉴别出来的,所以可以假设还有很多miRNAs在分离和鉴定过程中被“漏掉”了,测序工作还远远不够。 siRNA miRNA和siRNA之间的关系令人迷惑。从表面上说,一个是非编码的单链小分子RNA,在进化上高度保守,通过翻译抑制调控基因表达;另一个是针对编码区的双链小分子RNA,每个转录本都可能有很多个siRNAs,是通过降解目标靶,在转录后调控基因表达。由于每个mRNA模版可能产生很多个siRNAs,要给每个siRNA定一个基因的名字就很困难。miRNA是进化进程中高度保守的,因此给直向同源物一个同样的名字可能有助于了解他们的功能,而给另一个物种中一段无关的序列一个同样的名字就容易造成混乱。 然而,据推测miRNAs通常是由较大的(70­90 nt)的茎环结构(发夹结构)前体经Dicer酶切割得到的,而Dicer同样负责将长双链RNA切割为siRNA,而且二者的长度也差不多,同样有调控基因表达功能。因而这两类小分子RNA之间的关系格外令人关注。 两个广为人知的miRNA——线上虫中首次发现的lin-4 和let-7,通过一种未知方式诱发蛋白质翻译抑制从而抑制蛋白质合成。这种结合并不诱导mRNA靶的降解,就是说作为翻译抑制子本身不影响对应mRNA的丰度,其原因据推测是由于miRNA和结合位点之间不完全互补。这就区别于siRNA的介导的mRNA的降解。但是其他一些miRNAs可能以类似siRNA的方式介导目的RNA的降解。实验表明引入和let-7目的mRNA靶完全互补的miRNA会诱导mRNA靶的降解。还有实验结果表明一些miRNA,包括在植物中发现的Scarecrow miRNA,能结合完全互补的mRNA链从而降解mRNA序列,抑制蛋白合成。这提示miRNAs可以和siRNAs一样作用,这两种小分子RNA作用通路可能有重叠的部分。这种重叠同样提示siRNAs可能也有和miRNAs同样的功能。 一个很有趣的实验证实这个观点:Doench和同事挑选一个已知在体内可以有效使CXCR4基因沉默的siRNA,然后在萤光素酶报告基因的3’端插入对应的CXCR4结合位点——其中一个拷贝是插入一个完全匹配的CXCR4结合位点,另一个拷贝插入4个只有3’和5’端匹配,而中间不同的CXCR4结合位点,这样选定的siRNA就不能完全结合到这个结合位点——中间形成一个突起的不匹配的环。将这两个拷贝转入Hela细胞并用siRNA诱导基因沉默。结果很有趣——两个实验都录得萤光素酶活性下降了超过10倍,RT-PCR和Northern分析证实,第一个实验的萤光素酶转录本下降了超过10倍,这正是正常的siRNA介导的RNAi反应,目标靶mRNA降解导致表达水平的下降,而第二个实验中萤光素酶转录本仅仅下降12倍,这种目的基因表达水平下看起来象源于miRNA介导的翻译抑制降,而不是siRNA介导的影响mRNA的稳定性导致。实验表明:siRNA可能以miRNA的方式作用于mRNA。实验人员还进行了另一个实验:改变第二个实验中的不匹配环的碱基序列看起来不影响抑制效果,但是siRNA和报告基因上的结合位点的匹配程度越高抑制效果越好,增加siRNA的量,抑制效果越好——这一点和siRNA抑制的情况一样——唯一不同的是:完全匹配的结合位点(siRNA作用方式)可以单独起作用而相互不影响,而增加不完全配对的结合位点(注意在第二个实验中用了4个CXCR4结合位点)的个数对翻译抑制有显著的加乘作用。 在哺乳动物细胞中还没有找到内源的siRNA,外源的siRNA介导的RNAi作用正是一种抵御机制。而miRNAs则广泛存在于哺乳动物细胞中,从理论上推测可能参与多种调控作用。这两种小东西的作用机制和相互关系的本质就显得更加扑朔迷离。如何在实验中正确鉴定siRNA和miRNA,甚至是其他的小分子RNA都成为一个值得关注的问题。 待解决问题 miRNAs在多个物种中广泛被发现,而且在进化上高度保守。这些“小玩意儿”留给我们一大堆谜团:miRNA的确切功能是什么?它的目标靶是什么?作用机制是什么?也许需要对植物或者线虫的基因组进行miRNAs突变株的筛选,在果蝇中可以用targeted-disruption缺失miRNA序列。对miRNA突变株伴随的表型缺失进行研究,有助于解释miRNAs的功能。 正如Phillip Zamore说的:“如果miRNAs在进化的进程中如此高度保守而没有任何实际功能,那真是大自然拿科研人员开涮——而且是一个残酷的玩笑”。 研究工具 随着小分子RNA日益受到研究人员的重视,很多研究小分子RNA的新方法不断推出。 分离 由于小分子RNA可能参与分化、发育、组织生长、脂肪代谢等生理过程,在不同的组织和发育阶段的表达水平有所不同,进一步了解小分子RNA的生物功能需要确定其在各种生物样品中的表达水平,因而需要一种精确的定量纯化方法,从而得到可信的数据。 现行的RNA纯化方法包括有机溶剂抽提+乙醇沉淀,或者是采用更加方便快捷的矽胶膜离心柱的方法来纯化RNA。由于矽胶膜离心柱通常只富集较大分子的RNA(200nt以上),小分子RNA往往被淘汰掉,因而不适用于小分子RNA的分离纯化。有机溶剂抽提能够较好的保留小分子RNA,但是后继的沉淀步骤比较费时费力。mirVana miRNA Isolation Kit是采用玻璃纤维滤膜离心柱(glass fiber filter,GFF),既能够有效富集10mer以上的RNA分子,又能够兼备离心柱快速离心纯化的优点,是一个不错的选择。对于特别稀有的分子,由于需要分离大量RNA而导致高背景而降低灵敏度,还可以进一步富集10mer到200bp的小分子RNA来提高灵敏度。 探针制备 方法其实很简单:只需要准备目的基因的一小段寡核苷酸序列,3’端另外增加8个和T7启动子互补的碱基,将这段寡核苷酸和T7启动子引物退火,用Klenow大片断补齐得到双链的转录模版,然后用T7 RNA聚合酶、rNTP和标记物混合,体外转录得到标记的小分子RNA探针。这种方法可以快速制备各种标记(同位素、非放射性标记均可)的小于100nt的小分子RNA探针,适用于包括RPAs,Northerns 和原位杂交等各种方法检测小分子核仁RNA( small nuclear RNA,snRNA),small interfering RNA (siRNA),,micro RNA (miRNA)和 mRNA。非放射性标记的探针还可以用于原位杂交研究miRNA或者mRNA在组织中的分布。 检测 由于小分子RNA是一类很小的分子,部分小分子RNA表达水平可能很低,因而需要极为灵敏而定量的分析工具。由于其分子很小,用RT-PCR的方法来定量研究非常困难,多数研究人员采用Northern Blots——一种技术复杂而费力的方法来检测小分子RNA的存在。传统的Northern Blot的方法是是用探针检测固相支持物(膜)上的目标分子,由于用探针检测液相中的目标分子远比检测固相中的目标更为灵敏,生物通在这里为大家推荐一种基于核酶保护分析方法改进的新方法——将同位素标记好的小分子RNA探针和待检测样品混合杂交,未杂交的RNA和多余的探针用单链核酸酶消化,然后使核酸酶失活,并纯化杂交的RNA分子,最后通过变性胶电泳放射自显影检测结果。这个基于液相杂交的新方法不但 *** 作简单而快速,而且灵敏度极高——可以半定量检测少至10ng总RNA模版中的小分子RNA,或者说,可以检测attomole (10-18 mol)级别的靶目标!灵敏度是Northern Blot的100倍。除此之外,研究人员还可以在同一个样品中同时检测多个小分子RNA和长的RNA模版。应该说,这个灵活巧妙的设计可以为从事小分子RNA实验的研究人员带来不少方便。 总而言之,无论是siRNA, miRNA, snRNA还是其他的小东西,小分子RNA研究的不断深入将帮助我们揭示更多生命的奥秘。 功能分析 miRNA 的上调可用于鉴定功能获得表型;抑制或下调可以研究功能缺失表型。上调与下调的结合可用于鉴定被特定miRNA 调节的基因,以及特定miRNA 参与的细胞进程。 MicroRNA功能分析 主套用包括: ◇miRNA 靶定位点的鉴定和验证 ◇筛选调节某个特定基因表达的miRNAs ◇筛选影响某个特定细胞进程的miRNAs miRNA展望 miRNA在细胞分化,生物发育及疾病发生发展过程中发挥巨大作用,越来越多的引起研究人员的关注。随着对于miRNA作用机理的进一步的深入研究,以及利用最新的例如miRNA晶片等高通量的技术手段对于miRNA和疾病之间的关系进行研究,将会使人们对于高等真核生物基因表达调控的网路理解提高到一个新的水平。这也将使miRNA可能成为疾病诊断的新的生物学标记,还可能使得这一分子成为药靶,或是模拟这一分子进行新药研发,这将可能会给人类疾病的治疗提供一种新的手段。
嘿嘿,这个很简单,我来告诉你:你首先登入mirbase数据库,进入到download页面,其实就是这个网址:>
请问将二代测序得到的序列比对到miRBase鉴定已知miRNA时,应选择miRBase中的mature序列还是hairpin序列啊?
看到miRBase中同时有hairpinfa和maturefa两个数据文件,迷惑了
microRNAs(miRNA)是一种大小约21-23个碱基的单链小分子RNA,是由具有发夹结构的约70-90个碱基大小的单链RNA前体经过Dicer酶加工后生成,不同于siRNA(双链),但是和siRNA密切相关。据推测,这些非编码小分子RNA(miRNA)参与调控基因表达,但其机制区别于siRNA接到的mRNA降解。第一个被确认的miRNA是在线虫中发现的lin-4和let-7,随后多个研究小组在包括人类、果蝇、植物等多种生物物种中鉴别出数百个miRNA。
miRNA有高等生物基因组编码,通过和靶基因mRNA碱基配对引导沉默复合体(RISC)降解mRNA或阻碍其翻译。其在物种进化总相当保守,在植物、动物和真菌中发现的miRNAs只在特定的组织和发育阶段表达,miRNA组织特异性和时序性,决定组织和细胞的功能特异性,表明miRNA在细胞生长和发育过程的调节过程中其多种作用。
microRNAs的作用机制
miRNA是一类多细胞动物或植物基因组的前体mRNA内含子,miRNA独立转录单位或miRNA基因簇编码的19-25个核苷酸大小的内源性单链RNA,他们在转录后水平沉默特定基因从而对生物体基因表达起到精细调节的作用[1]。绝大多数miRNA基因在RNA聚合酶Ⅱ的作用下形成较长的茎环结构,称为初级miRNA(primary miRNA ,pri- miRNA)。pri- miRNA在Drosha-DGCR8复合体的作用下形成长度约60-70个核苷酸的发夹状RNA,成为前体miRNA(precursor miRNA,pre-miRNA)。随后,pre- miRNA在Exprotin-5复合物[2]的作用下被转运出胞核,在胞浆中由Dicer剪切成为miRNA复合体, miRNA复合物(RNA-induced silencing comlex,RISC)[1]与该miRNA的3’翻译区(3’UTR)结合到位于胞浆的P-body(processing bady)中[3]:如果miRNA与靶mRNA匹配完全,则该复合体降解mRNA;若两者序列部分匹配,尤其是miRNA的5’端2-8个被称为种子序列(seed sequence)的核苷酸与靶mRNA匹配完好,则通过抑制靶mRNA的翻译来沉默特定基因。此外,某些miRNA,如miRNA-16能够特异结合于某些基因3’UTA的富含AU元件(AU rich element,ARE),指导Ago等组成RISC区的蛋白与TTP结合,从而改变相应mRNA的半衰期,加速靶mRNA的降解。
此外,miRNA也可能抑制5’UTR含有内部核糖体进入位点(intrnal ribosome entry sites,IRESs)的靶标分子[4]。
miRNA的表达调控机制
①顺时调控元件 大多数miRNA基因的核心启动子区域含有TA盒,并且含有影响miRNA表达的细胞特异转录调节元件。miRNAs作为转录因子重要的靶分子在细胞功能调控中发挥核心作用。
②表观遗传学 最近一些研究提示,表观遗传学变化会影响miRNA 基因,从而调节miRNA表达。分析基于miRNAse(release 80)数据库的332个人miRNA基因序列时,发现其中155个miRNA的基因序列上游或下游2000bp处含有CG岛在miR-127[6],miR-24a[6],let-7a-3[7]和miR-370[8]基因中,均含有CpG岛,并且在相应地肿瘤组织中呈现高度甲基化,这些miRNA在肿瘤中的甲基化沉默将导致他们的靶基因-原癌基因(BCL6,CDK6和MAP3K8等)的表达,从而促进肿瘤发育。转录因子PRDM5可能参与了调解miRNAs基因的表观遗传学变化。在HEK293细胞中,PRDM5可以募集蛋白甲基化转移酶G9a和一类组蛋白去乙酰基酶等组蛋白修饰到has-mir-135b基因的启动子区域,行使抑制功能[9],miRNA在癌症细胞中的表达一般低于正常组织细胞,这表明多数miRNAs可能作为肿瘤抑制因子而发挥作用。原癌基因的低度甲基化和肿瘤抑制基因的高度甲基化被认为是癌症表观遗传学的主要决定因素。miRNAs基因在肿瘤中的异常甲基化使表观遗传学调控癌症机理更加复杂。
③单核苷酸多态性 存在于pri-mRNAs,pri-mRNA或成熟miRNAs基因序列中的单核苷酸多态性(single nucleotide polymorphism,SNP)能够潜在地影响miRNA调节的细胞功能网络。miRNA基因或靶结合位点及其临近靶位点区域的多态变化时,于miRNA的生物合成及靶位点选择和抑制效应据重要的意义。
④RNA编辑 (RNA editing)是基因在初级转录物上增删或取代某些核苷酸而改变遗传信息的过程,从而可调节基因的表达。RNA编辑在miRNA调控基因默过程中其重要作用,不仅影响miRNA表达,而且影响特异miRNA的靶向分子的调控。此外,At编辑也有可能存在于靶分子的种子互补区域。
有点长,不知道你用的是哪个测序平台,illumina测序平台是miRNA大约22-24bp,加上接头和index长度约为80bp,所以文库长度应该在110bp左右。不同的测序平台,接头长度不同,所以如果你不是illumina测序平台,这个长度也是有可能的。
高通量测序又称NGS,重新定义了基因组学研究。近年来,NGS技术稳步发展,伴随着成本下降以及测序应用呈指数增加。本文,我们研究了影响测序文库质量的关键因素,以及,在DNA来源和RNA来源文库准备过程中存在的挑战。这些因素包括,DNA/RNA材料的定量和物理性质以及潜在应用(比如,基因组测序、靶向测序、RNA-seq、ChIP-seq、RIP-seq和甲基化),在制备高质量测序文库的内容中将提到。另外,我们也会讨论制备单细胞来源的文库的方法。
在过去的5年里,NGS技术在生命科学领域的研究人员中得到了广泛应用。与此同时,随着测序技术的发展和进步,衍生了一些核酸提取和文库制备的方法。比如,已经可以成功利用来自单细胞的RNA和DNA进行文库的制备 NGS文库制备的基础是将靶向的核酸、RNA或DNA 改造成测序仪可以使用的形式(Fig 1)。在这儿,我们对比了多个文库制备策略以及NGS应用,主要着眼于与illumina测序技术兼容的文库。但是,需要指出一点,本文讨论的几乎所有原则只要稍加修饰便可应用于其他NGS平台,比如,Life Technologies、Roche和Pacific Biosciences。
一般来说,文库制备的核心步骤包括:1)片段化及或选出特定长度的片段,2)将其转化为双链的形式,3)将寡核苷酸接头连接至片段末尾以及4)对文库进行定量;目标DNA片段的大小是NGS文库构建的关键因素。对核酸进行片段化的方法主要包括物理、酶切和化学的方法。物理方法包括声波剪切(代表:Covaris)和超声(代表:BioRuptor),酶切方法包括非特异性内切酶和转座酶片段化;我们实验室中,Covaris, Woburn, MA主要用于获得100-5000bp范围的DNA片段,而Covaris g-TUBEs主要用于mate-pair文库所必需的6-20kb范围的DNA片段。酶切的方法包括DNase I或片段化酶的消化,一个两种酶的混合(New England Biolabs, Ipswich MA)。两种方法都很有效。但是,片段化酶相比物理方法会产生更多的假indel。另一种酶切方法是Illumina的Nextera,利用转座酶进行随机片段化并把接头序列插入双链DNA中。 这种方法有几个优势,包括,减少样品处理和制备的时间。
文库大小是由插入片段(指的是接头序列之间的文库部分)大小决定的,因为接头序列的长度是不变的。反过来说,最佳插入片段长度是有NGS设备以及特定测序应用决定的。比如, illumina中,最佳片段大小是受簇生成过程影响的,这个过程包括,文库编写、稀释以及分布至芯片表面进行扩增。虽然,短片段扩增更加有效,长片段文库能够产生更大、更弥散的簇。我们用illumina测序的文库最大为1500bp。
最佳文库大小也是由测序应用决定的。对于外显子测序来说,80%以上的人类外显子长度小于200bp。我们测试PE100bp,外显子文库大小约为250bp,这样可以匹配大多数外显子的平均大小,结果中没有重叠的读对。 RNA-seq文库大小也是由应用决定的。对于基因表达分析我们采用SE100的测序。但是对于,可变剪切或转录起始终止位点的判定,我们选择PE100的方案。大多数应用中,RNA在片段化之前会逆转录成cDNA的形式。一般是利用二价金属离子(镁或锌)对RNA进行可控的热消化。文库片段大小可以通过调节消化反应的时间来控制,重复性很好。
在最近对7个RNA-seq文库制备方法的研究中,大多是先对RNA进行片段化然后进行加接头。有两种方法,不利用随机引物,或者说在SMARTer Ultra Low RNA试剂盒中, 合成具有固定3',5'序列的全长cDNA序列。 全长的cDNA文库(平均2kb)可以通过长距离PCR(LD-PCR)进行扩增。这种扩增的双链cDNA再通过声波剪切至合适的长度,用在标准的illumina文库准备过程中(包括,末端修复和补平,加A和接头连接,再通过PCR进行扩增。)
另一种文库构建后对文库大小处理步骤是片选以及去除接头二聚体或其他文库制备的副产物。接头二聚体是接头自连的结果。这些二聚体成簇效率非常高,而且会消耗掉珍贵的芯片空间,但不产出任何有效数据。因此,我们通常利用磁珠法或切胶回收。磁珠法适用于起始材料比较充足的情况。若样本投入有限,就会生成更多的接头二聚体。我们的经验是,磁珠为基础的方法在这种情况下不适用,需要结合磁珠和切胶回收的方法。
在microRNA/small RNA文库制备过程中,目的产物通常只比120bp的接头二聚体长20-30bp。因此,必须使用切胶回收的方法获得尽可能多的目的序列。这种分离精度对于磁珠来说就不适用。另外,我们经常需要建大插入片段(1kb)的文库,结合更长的读长PE300以及无PCR步骤,用于细菌基因组的从头组装。为了尽可能获得可用于组装的数据,就必须要小心地进行切胶回收以获得大小较为一致的插入片段。
在利用DNA样本进行文库构建过程中有几个考虑,包括起始材料的量以及该文库是用于重测序(有可用于比对的参考序列)还是从头测序(需要利用此次下机数据组装出新的参考序列)。文库制备容易存在bias,这是由于基因组存在高GC或低GC的区域,目前已经开发了解决这些问题的方法,包括仔细选择用于扩增的聚合酶、循环数、条件以及缓冲液等。
DNA样本的文库制备,不管是用于WGS、WES、ChIP-seq还是PCR扩增子,一般都遵循相同的流程。总的来说,对于任何应用,目标都是使文库尽可能的复杂。
DNA建库试剂盒目前有多个品牌。竞争也促使价格迅速下降以及质量的提升。这些试剂盒能够处理DNA起始量从ug到pg多个级别。但是,我们需要记住一点,起始量大可以降低扩增循环数,因此文库复杂度更高。除Nextera外,文库制备步骤通常包括:1)片段化,2)末端修复,3)5端磷酸化,4)3端加A,5)接头连接,6)几个cycle的PCR以富集加了接头的产物。Ion Torrent流程的主要不同在于平末端连接不同的接头序列。
起始DNA被片段化后,会使用3个酶的混合物( T4 多聚核苷酸激酶、T4 DNA聚合酶以及 Klenow大片段 )进行末端补平和5端磷酸化。3端加A尾利用Taq聚合酶或Klenow片段(exo-)。Taq在加A尾上更有效率,但Klenow在不能用加热方法时,比如mate-pair文库可以适用。在接头连接过程中,最适的接头:片段比例大约为10:1,以摩尔数为单位。接头太多会形成难以分离的二聚体,这些二聚体在随后的扩增中会占主导地位。末端修复和加A反应后,磁珠或胶回收的方法都适用,但连接反应后我们发现,磁珠的方法能够更有效地去除接头二聚体。
为了便于多样本混合,可以对不同样本使用不同barcode的接头。另外barcode也可以由PCR扩增过程经不同barcode的引物加入。可以从多个供货商购买高质量的带barcode的接头和PCR引物。 目前DNA文库构建的所有组分,从接头到酶,都有详细的文字说明,可以组装成自制的文库制备试剂盒。
另一种方法是Nextera方法,利用转座酶对DNA进行随机打断,并在一个单管中对其加标签(又称tagmentation)。这种工程化的酶有两个功能,对DNA进行片段化,并将特定的接头加到片段化DNA的两端。 这些接头序列在接下来的PCR过程中用于扩增插入片段。PCR反应会加入barcode。这个制备过程相对传统方法的优势在于,将片段化、末端修复和接头连接合并成一步。这种方法相对于机械片段化的方法来说,对DNA的起始量更加敏感。为了实现在合适的距离进行片段化,转座酶相对样本的比例非常关键。因为片段大小依赖于反应效率,所有反应的参数,比如,温度和反应时间,都非常关键,需要严格控制。
一些课题组发表了对单个细胞基因组进行测序的结果。现在的策略采用多重链置换(MDA)对整个基因组进行扩增。MDA主要是利用了随机引物和phi29,一种高度进行性的链置换聚合酶。虽然这个技术能够产生足够的量用于测序文库的构建 ,但它的一个问题在于非线性扩增造成的大量的bias。最近有研究认为通过加入一个半线性的预扩增步骤能够减少bias。Fluidgm基于单细胞分离和微流控技术用于单细胞文库制备,每次运行可获得最多96个单细胞。
对于RNA文库,我们需要根据测序目的来进行文库构建方案的筛选。如果目的是发现复杂全面的转录事件,文库需要覆盖整个转录组,包括,编码、非编码、反义以及基因间RNA,而且需要尽可能的完整。但是,很多场合,目的只是研究能够翻译成蛋白质的编码mRNA的转录本。另一种情况只涉及small RNA,大多miRNA,也包括snoRNA,piRNA,snRNA以及tRNA。虽然,我们想要详述RNA测序文库的原则,但无法一一列举。感兴趣的读者可以自行研究。
NGS应用到RNA-seq最初成功的例子之一是 miRNA 。制备miRNA测序文库非常简单,通常是一步反应。事实上,miRNA在5端有天然磷酸修饰,这允许连接酶选择性地靶向miRNA。
illumina步骤的第一步,3端阻断,5端腺苷化的DNA接头通过截断的T4 RNA连接酶2被连接至RNA样本。这个酶经过修饰,能够对3端接头底物进行腺苷化。结果是,其他RNA片段在这个反应中不会连接在一起。只有腺苷化的寡核苷酸可以连接到游离的RNA的3端末端。由于接头3端是阻断的,无法进行自连。下一步,在ATP和RNA连接酶1的作用下加入5端RNA接头。 只有5端磷酸化的RNA分子能够在连接反应中作为有效的底物。第二步连接反应后,逆转录引物杂交到3端接头,开始启动RT-PCR 扩增(一般是12个循环)。由于小且片段大小可预测(120bp 接头序列加上20-30bp miRNA插入片段),文库或多个barcode混合样本通常一起进行切胶回收。 由于存在接头二聚体以及非miRNA的连接(tRNA和snoRNA),切胶回收非常重要。这种文库制备方法导致文库的测序具有方向性,总是从原始RNA的5端到3端。Ion Torrent 的miRNA测序原则也是相似的。Ion Torrent利用两种不同的接头连接至miRNA 3端和5端,随后进行RT-PCR。一般,文库构建步骤可以将任何RNA材料构建成有方向性的RNA-seq文库。
miRNA文库的一大限制在于RNA的起始量低(<200ng 总RNA);短接头二聚体在RT-PCR反应中与目的产物、接头和miRNA进行竞争。 当存在太多二聚体时,他们会在片段筛选时充斥整个凝胶,污染产物条带。为了尽量避免这种情况,很多试剂盒采取了各种方式来避免二聚体的形成。
对于mRNA测序文库,方法主要包括利用随机引物或oligo-dT引物进行cDNA合成或在mRNA片段上加接头后进行某种形式的扩增。mRNA可以由随机引物或oligo-dT起始产生一链cDNA。如果使用随机引物,必须先将rRNA去除或减少。rRNA可以通过寡核苷酸探针为基础的试剂,比如,Ribo-Zero和RiboMinus,进行去除。另外,polyA RNA可以通过oligo-dT磁珠进行正向筛选。
通常希望文库能够留有原始目的RNA的链的 方向性 。比如,逆转录产生的反义RNA在调节基因表达中发挥作用。实际上,lncRNA分析依赖于定向RNA测序。制备定向RNA-seq文库的方法有几种。逻辑时,进行cDNA反应,将两条链中的1条有选择地移除,通过,在第二条cDNA链合成时加入dUTP。尿嘧啶包含的链可以被响应的酶消化掉或者扩增的时候用不识别尿嘧啶的聚合酶。 另外,加入actinomycin D可以减少一链cDNA合成过程中假义链的合成。
另一种杂交方法利用随机或锚定oligo-dT引物的接头序列起始第一链cDNA的合成。接下来,在模板转换步骤,3端接头序列添加到cDNA分子。这种方法的明显优势在于第一链cDNA分子可以利用3端的唯一序列标签无需进行第二链合成,直接通过PCR进行扩增。5端唯一序列标签在第一链合成过程中引入。
用于cDNA合成的引物设计对于RNA-seq文库非常重要。比如,rRNA序列可以通过设计靶向rRNA的引物(不用于进一步扩增)进行去除。 NuGEN Ovation RNA-seq结合SPIA( Single primer isothermal amplification )核酸扩增技术以及用于第一链cDNA合成的引物来抑制rRNA的扩增。另一种方法中利用4096种六聚体来抑制rRNA序列(识别并消除完美匹配)。749种六聚体保留并用于起始第一链cDNA合成反应。结果是,rRNA reads从78%降至13%。还有一种方法叫, DP-seq ,利用44个7聚体引物扩增了大部分的小鼠转录本。这种引物设计选择性地抑制了高表达转录本的扩增,包括rRNA,并提供了胚胎发育模型中低丰度转录本的估计。
最近发表了一些制备单细胞RNA文库的方法。一种方法利用第一链cDNA的多聚核苷酸尾巴,结合模板转换反应。结果是第一链cDNA产物可以通过通用PCR引物进行扩增。如图,Figure4B所示,且已并入是试剂盒中。另一种方法叫 CEL-Seq ,在cDNA 5端合成T7启动子序列,随后在体外转录过程中进行现象扩增。
单个细胞的总RNA一般为10pg,但polyA RNA只有01pg。因此,这些方法某种程度上需要全转录本扩增以产生足够的建库所需起始量。这样大量扩增的弊端就在于大量技术噪音的产生,这一问题目前尚未解决。 (?)
最后,核糖体印记能够反应翻译的任何节点上细胞mRNA转录本的混合。这种方法涉及到利用RNase对细胞进行裂解,只留下被核小体保护的30个核苷酸的区域。核小体经蔗糖梯度密度离心进行纯化,接着mRNA被从核小体中提取出来。另一种新的RNA测序的应用是 SHAPE-Seq,通过酰化试剂来偏向性地修饰未配对的碱基以探索RNA的二级结构。通过对修饰的RNA和未修饰的对照进行逆转录,对得到的cDNA片段进行测序,比较后能够揭示核苷酸水平的碱基配对信息。
如果是大规模测序,你可能需要基因组或者转录组,找出能map到基因组或转录组上的miRNA,然后找出其中已经有的已知的该物种miRNA,再分析未知的,即能够与其他物种已知miRNA比对上的保守miRNA和不能比对到其他物种已知miRNA的非保守miRNA,然后对于已知和未知的并且有基因组的可以找出其在基因上的位置,对于未知的需要通过物种cDNA和找到target等。
如果只是少量的小RNA测序,可以直接找出其基因上的位置和target。
个人觉得lncrna更有研究前景,mirna序列段作用单一(通过序列互补靶向靶基因降解或者抑制靶基因)各种mirna数据库以及针对mirna靶基因预测软件以及数据库甚至高通量实验都已经非常完善。但是lncrna是刚处于研究的起始阶段,其功能机制都不太明确,现有研究只能说明lncrna具有多种功能,因此如果你做lncrna可做的东西非常多,加上lncrna功能复杂因此更具有研究前景。个人觉得lncrna更有研究前景,mirna序列段作用单一(通过序列互补靶向靶基因降解或者抑制靶基因)各种mirna数据库以及针对mirna靶基因预测软件以及数据库甚至高通量实验都已经非常完善。但是lncrna是刚处于研究的起始阶段,其功能机制都不太明确,现有研究只能说明lncrna具有多种功能,因此如果你做lncrna可做的东西非常多,加上lncrna功能复杂因此更具有研究前景。
以上就是关于micro RNA详细资料大全全部的内容,包括:micro RNA详细资料大全、如何获得miRBase中所有的成熟miRNA的序列信息、如何查看geo数据库上既有表达谱数据又有mirna等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)