生物的基因组中,特别是高等生物的基因组中含有大量的重复序列,根据重复序列在基因组中的分布形式可将其分为串联重复序列(Tandem Repeats Sequence,TRS)和散布重复序列(Dispersed Repeats Sequence,DRS)。其中,串联重复序列是由相关的重复单位首尾相连、成串排列而成的。发现的串联重复序列主要有两类:一类是由功能基因组成的(如rRNA和组蛋白基因);另一类是由无功能的序列组成的。 根据重复序列的重复单位的长度,可将串联重复序列分为卫星DNA、微卫星DNA、小卫星 DNA等。微卫星DNA又叫简单重复序列(Simple Sequence Repeat,SSR),指的是基因组中由1-6个核苷酸组成的基本单位重复多次构成的一段DNA,广泛分布于基因组的不同位置,长度一般在200 bp以下。研究表明,微卫星在真核生物的基因组中的含量非常丰富,而且常常是随机分布于核DNA中。在植物中通过对拟南芥、玉米、水稻、小麦等的研究表明微卫星在植物中也很丰富,均匀分布于整个植物基因组中,但不同植物中微卫星出现的频率变化是非常大的,如在主要的农作物中两种最普遍的二核苷酸重复单位(AC)n和(GA)n在水稻、小麦、玉米、烟草中的数量分布频率是不同的。在小麦中估计有3000个(AC)n序列重复和约6000个(GA)n序列重复,两个重复之间的距离平均分别为704 kb、440 kb,而在水稻中,(AC)n序列重复约有1000个左右,(GA)n 重复约有2000个,重复之间的平均距离分别为450 kb、225 kb。
另外在植物中也发现一些三核苷酸和四核苷酸的重复,其中最常见的是(AAG)n、(AAT)n。在单子叶和双子叶植物中SSR数量和分布也有差异,平均分别为646 kb和212 kb中有一个SSR。研究还发现,单核苷酸及二核苷酸重复类型的SSR主要位于非编码区,而有部分三核苷酸类型位于编码区。另外在叶绿体基因组中,也报道了一些微卫星,以A/T序列重复为主。研究发现,微卫星中重复单位的数目存在高度变异,这些变异表现为微卫星数目的整倍性变异或重复单位序列中的序列有可能不完全相同,因而造成多个位点的多态性。如果能够将这些变异揭示出来,就能发现不同的SSR在不同的种甚至不同个体间的多态性,基于这一想法,人们发展了SSR标记。SSR标记又称为序列标签微卫星位点(sequence tagged microsatellite site),简写为STMS,是目前最常用的微卫星标记之一。由于基因组中某一特定的微卫星的侧翼序列通常都是保守性较强的单一序列,因而可以将微卫星侧翼的DNA片段克隆、测序,然后根据微卫星的侧翼序列就可以人工合成引物进行PCR扩增,从而将单个微卫星位点扩增出来。由于单个微卫星位点重复单元在数量上的变异,个体的扩增产物在长度上的变化就产生长度的多态性,这一多态性称为简单序列重复长度多态性(Simple Sequence length polymorphism,SSLP),每一扩增位点就代表了这一位点的一对等位基因。由于SSR重复数目变化很大,所以SSR标记能揭示比RFLP高得多的多态性,这就是SSR标记的原理。与其它分子标记相比,SSR标记具有以下优点:①数量丰富,覆盖整个基因组,揭示的多态性高;②具有多等位基因的特性,提供的信息量高;③以孟德尔方式遗传,呈共显性;④每个位点由设计的引物顺序决定,便于不同的实验室相互交流合作开发引物。因而该技术已广泛用于遗传图谱的构建、目标基因的标定、指纹图的绘制等研究中。但应看到,SSR标记的建立首先要对微卫星侧翼序列进行克隆、测序、人工设计合成引物以及标记的定位、作图等基础性研究,因而其开发费用相当高,各个实验室必须进行合作才能开发更多的标记。由于SSR标记具有较大的应用价值,且种属特异性较强,在一些主要的农作物中SSR标记研究都进行了合作,共同进行STMS引物的开发。 简单重复序(Simple Sequence Repeat,SSR)
简单重复序(SSR)也称微卫星DNA,其串联重复的核心序列为1一6 bp,其中最常见是双核苷酸重复,即(CA) n和(TG) n每个微卫星DNA的核心序列结构相同,重复单位数目10一60个,其高度多态性主要来源于串联数目的不同。SSR标记的基本原理:根据微卫星序列两端互补序列设计引物,通过PCR反应扩增微卫星片段,由于核心序列串联重复数目不同,因而能够用PCR的方法扩增出不同长度的PCR产物,将扩增产物进行凝胶电泳,根据分离片段的大小决定基因型并计算等位基因频率。在真核生物中,存在许多2-5bp简单重复序列,称为“微卫星DNA”其两端的序列高度保守,可设计双引物进行PCR扩增,揭示其多态性。
SSR具有以下一些优点:(l)一般检测到的是一个单一的多等位基因位点;⑵微卫星呈共显性遗传,故可鉴别杂合子和纯合子;⑶所需DNA量少。显然,在采用SSR技术分析微卫星DNA多态性时必须知道重复序列两端的DNA序列的信息。如不能直接从DNA数据库查寻则首先必须对其进行测序。 复合型(compound)。指2个或2个以上的串联核心序列由3个或3个以上的连续的非重复碱基分隔开,但这种连续性的核心序列重复数不少于5。如:ATATATATATATATGGGATATATATATATA
3种类型中完全型是SSR标记中应用较多的一种类型。 SSR在植物基因组中的分布SSR广泛分布于各种真核生物的基因组中,大约每隔10~50kb就存在一个SSR。哺乳动物中的SSR的数量大约为植物中的5~6倍。在植物中,平均233kb就有一个SSR;双子叶植物中的SSR数量大于单子叶植物,前者两个SSR之间的平均间距为212kb,后者为646kb;核DNA中的SSR数量多于细胞质DNA中的SSR,绝大多数单碱基重复型及2碱基重复型SSR存在于非编码区,3碱基重复型多位于编码区。 借鉴其他近缘种序列。
通过筛选文库、测序开发自己的SSR引物。
通过核酸数据库查询,从已有序列中搜寻包括SSR的序列并设计引物。 提取DNA;PCR扩增;电泳及显色;电泳胶板带型的照相、记录;数据分析处理。
其中,PCR产物分离的电泳方法主要有:高浓度琼脂糖电泳(4%胶只能分辨4-6bp差异);变性聚丙烯酰胺序列胶电泳;非变性聚丙烯酰胺凝胶电泳。
由于扩增的片段短(一般小于300bp),基因间的差异小(一般为几个bp),故通常使用分辨率高的聚丙烯酰胺凝胶电泳。在程序上,变性胶虽然比非变性胶麻烦些,但考虑到在非变性胶上会出现人为假象—异源双链分子,比如导致SSR杂合子中出现3-4条带,而不是正常的2条带,从而干扰等位位点统计,因此我们建议在SSR分析中均采用变性胶电泳。
PCR扩增产物显色方法有:同位素放射性自显影法;荧光染料标记法;溴化乙锭(EB)显色法;银染法(多用此法) 。
遗传分析仍是当前对致病相关基因识别、鉴定的主要方法,分为连锁分析和关联研究两种。由于人类基因组多态性的研究以及SNP分型技术的发展,目前全基因组连锁分析和关联研究亦变得切实可行。根据研究规模的大小,可以将疾病遗传分析分为以下几类,即定位克隆、连锁不平衡基因定位、全基因组候选基因分析、候选基因关联研究和定位候选基因克隆,其中定位克隆、连锁不平衡基因定位和全基因组候选基因分析均属于全基因组扫描。
不管是单基因疾病还是多基因疾病,通常是先行全基因组扫描(genome scanning);将疾病相关位点定位于染色体某个区域,然后再行候选基因策略或连锁不平衡分析,确定致病基因位点。如果利用家系进行连锁分析,即采用定位克隆;若是利用群体样本,则应用连锁不平衡分析进行基因定位。全基因组扫描已成功地应用在许多疾病的致病相关基因克隆上,并取得了一定的成果。
全基因组扫描所利用的是在人类基因组大量存在的微卫星或SNP,虽然当前使用较多的仍是微卫星,但由于芯片技术的发展,全基因组高分布密度的商品化SNP芯片相继面世(如Affymetrix公司的10k,100k和500k人基因组SNP芯片),越来越多的研究者使用SNP进行全基因组扫描。由于这些高密度的SNP芯片价格昂贵,不是一般的实验室所能承受。
微卫星全基因组扫描的原理是利用特定的引物将某条染色体上特定位置的微卫星扩增出来,并进行分析。这种分析所使用的微卫星通常具有较高的多态性,在不同的个体其长度不尽相同(也就是微卫星基本单位重复次数的不同),而不同长度的PCR产物则代表某一位点不同的等位基因。该种分析方法实际上是利用平均分布于各条染色体上的密度约为10cM的微卫星,检测每个微卫星是否存在与其邻近的疾病相关基因座位连锁。全基因组扫描并不能直接搜寻具体的疾病相关基因,而是通过研究均匀分布于整个基因组的微卫星标记来间接选择其相关的基因座位。在得到阳性结果后,又可在这些阳性位点附近再加密微卫星标记或利用SNP,用同样的方法来确定哪一个多态性位点与疾病连锁的可能性最大等等。这样在不断地缩小分析范围后,疾病相关基因定位的范围也越来越精细。由于人类基因组序列已知,一旦发现了与疾病相关基因连锁两侧的遗传标记,根据标记位点的具体位置,我们就可以知道定位区域内所有的基因。因此,当定位区域确定后,在该区域内选择候选基因直接进行测序,对所发现的突变在病人和对照组进行分型并分析,搜寻致病基因。另一个方法是直接从公共数据库挑选候选基因编码区、调控区(包括内含子)中的SNP,进行连锁不平衡分析,确定致病基因。
以上就是关于SSR的重复序列全部的内容,包括:SSR的重复序列、什么是全基因组扫描其用途是什么、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)