EST是Expressed Sequence Tag的缩写,意思是表达序列标签,指从一个随机选择的cDNA 克隆,进行5’端和3’端单一次测序挑选出来获得的短的cDNA 部分序列。
EST是从一个随机选择的cDNA 克隆进行5’端和3’端单一次测序获得的短的cDNA 部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20 到7000bp 不等,平均长度为360 ±120bp。
EST 来源于一定环境下一个组织总mRNA 所构建的cDNA 文库,因此EST也能说明该组织中各基因的表达水平。
扩展资料
EST的作用表现在:
1、 用于构建基因组的遗传图谱与物理图谱;
2、作为探针用于放射性杂交
3、 用于定位克隆;
4、借以寻找新的基因
5、作为分子标记;
6、 用于研究生物群体多态性。
参考资料来源:百度百科-EST
可以从数据库,比如EST数据库中查找。肽序列标签(peptidesequencetag)是2016年公布的化学名词,先以串联质谱测定目的蛋白质中部分肽段的序列和相应的质量数,然后通过在数据库中检索、鉴定蛋白质的方法。
通俗地说,转录图就像生命的乐谱。如果说人的每个细胞里的所有DNA决定6~10万基因的话,在每一种组织的细胞中,大概只有10%的DNA能表达,而表达的第一阶段就是“转录”。
我们知道,生物性状是由结构或功能蛋白决定的,功能蛋白是由信使RNA(mRNA)编码的,mRNA又是由编码蛋白功能基因转录而来的。转录图就是测定这些可表达片段(EST)的标记图。事实上,整个人类基因组中有97%的部分由不被转录的DNA组成,仅有2%~3%的DNA序列具有编码蛋白质的功能。在人体某一特定的组织中并非全部基因都表达。仅有10%的基因被表达。也就是说,只有不足1万个不同类型的mRNA分子(只有在胎儿的脑组织中,可能有30%~60%的基因被表达)。如果将这些mRNA通过一种反转录的过程构建成cDNA文库,然后再测定这些DNA的序列,最终绘制成一张可表达基因图——转录图。
首先,要不断地丰富EST数据库。DbEST是目前最大的一个公共功能性序列数据库,至1996年夏天,它已收集到40万种EST序列。其中大多数序列是在默尔克(Merck)公司资助下由华盛顿大学的序列测定项目提供的。这个数目并不代表人类基因组中可表达基因的数目(60000到100000个基因克隆),因为一个全长的cDNA可能产生几个不重叠的EST片断。由于发现这些可表达的EST片段——“真正的基因”具有潜在的经济效益,许多商业公司都非常重视EST片段的克隆和序列分析。比如美国人类基因组科学公司据称已得到了超过850000个EST片段的数据库,对应于可能的6000个不同的基因,与人类基因组的全部基因数已相差不多了。现在,国际数据库中所贮存的EST的数量正以每日1000多个的速度增加着。
下一步就是将EST片段在人的基因组中定位。即将这些EST片段与某些疾病的易感位点联系起来,许多国家正在寻求合作,通过对这些EST片段进行染色体定位,绘制一个真正的“转录图谱”。1994年,约有1000个EST片段得到定位,1995年增至10000个,1996年则达到20000个。这样,一旦确定了与某个疾病有关联的位点,转录图就可以告诉你在这个区域有哪些基因。是否所有的基因都能以EST片段的形式在染色体上得以定位呢?不是的。我们前面就已经知道EST片段是由mRNA经过反转录而来,不包括RNA的结构基因。此外,由于某些低水平表达的基因在构建cDNA文库时可能不包括于其中,因而EST也不能代表这些低水平表达的基因。这样,RNA的结构基因以及低水平表达的基因就不能以EST的方式被定位到转录图上。这个悬而未决的问题将随着整个基因序列的完成而得以解决。
转录图有特定的意义。首先,由于DNA的转录是有组织与时间特异性的,它来源于已知的某一生育阶段的某一组织。有人提出可以绘制一张反映在正常或受控条件中表达的数目、种类及结构、功能的信息。在将来的数据库中,我们可了解某一基因在不同时间、不同组织、不同基因、不同水平的表达;也可以了解某一特定时间,在不同时间、不同水平的表达;还可以了解一种组织中,在不同时间、不同基因、不同水平的表达。有了“正常”的转录图,就奠定了构建特定生理条件下与“异常”下cDNA图的基础,为步入21世纪的基因医学绘制了新的蓝图,即基因表达谱。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)