ORF的英文展开是open reading frame(开放阅读框)。
CDS的英文展开是coding sequences (编码区)。
ORF是理论上的氨基酸编码区,一般是在分析DNA核酸图谱中(主要是利用电脑程序)得到的。程序会自动在DNA序列中寻找启动因子(ATG或AUG),然后按每3个核酸一组,一直延伸寻找下去,直到碰到终止因子(TAA或TAG)。程序把这个区域当成ORF区,认为理论上可以编码一组氨基酸。
但问题是,在一个整体核酸序列中寻找ATG并不靠谱。因为寻找到的ATG很可能是两个氨基酸编码片段的尾和头的混合体。比如AACGCATGCAGC
看上面这个小序列,如果以T为中心,会有三种编码组合的可能。即
(1)ATG(T在中心)电脑程序发现的启动因子的组合
(2)CAT(T在最右侧)
(3)TGC(T在最左侧)本例中实际核酸编码的组合。
这就是ORF三种框架的来源。实际上,DNA序列可以按六种框架阅读和翻译(每条链三种,对应六种不同的三联密码子)。
所以,我们说ORF只是理论上的编码区,与真实的情景可能并不一样。
而CDS是检查cDNA后得到的编码组合序列,和实际情景比较接近。
EST技术最常见的用途是基因识别,传统的全基因组测序并不是发现基因最有效率的方法,这一方法显得既昂贵又费时。因为基因组中只有2%的序列编码蛋白质,因此一部分科学家支持首先对基因的转录产物进行大规模测序,即从真正编码蛋白质的mRNA出发,构建各种cDNA文库,并对库中的克隆进行大规模测序。Adams等提出的表达序列标签的概念标志着大规模cDNA测序时代的到来。虽然ESTs序列数据对不精确,精确度最高为97%,但实践证明EST技术可大大加速新基因的发现与研究。Medzhitov等通过果蝇黑胃TOLL蛋白进行dbEST数据库检索,该蛋白已证实在成熟果蝇抗真菌反应中发挥重要作用,通过同源分析的方法,找到相应的人类同源EST(登录号为H48602),这为接下来研究人类TOLL同源蛋白的功能提供了很好的条件。hMSH5基因是从酿酒酵母菌MSH5存在30%的一致性,它与hMSH4特异性相互作用,在减数分裂和精子发生过程中发挥一定的作用。由此可见,应用EST技术,可以跳过生物分类学的界限,从生物模型的已识别基因迅速克隆出人和小鼠基因组相应的更复杂的未知基因。生物间在核苷酸水平上的进化差异阻碍了传统意义上的杂交或以PCR为基础的基因克隆策略,即使是亲缘关系很接近的生物也不例外,如Celegans和Cbriggsae,它们仅在2~5千万年前分化形成。而通过计算机进行dbEST进行数据库筛选,其配制是电子杂交实验,提供了一条更为广泛的基因识别路线,这一路线允许基因组间存在差异,这使得基因识别与新基因克隆策略发生革命性变化,同时它也提供了一个足够大小和复杂的基因数据库,ESTs数量正以平均每月10万条的速度递增。
est、crq都是User,
esttableA意思是tableA这张表归属於est这个User
有兴趣你可以查查数据库的ABCD层级的意思,很容易就能理解你的疑问了
以上就是关于解释CDS、cDNA、EST、mRNA、ORF间的区别全部的内容,包括:解释CDS、cDNA、EST、mRNA、ORF间的区别、EST序列的基因识别、est 在数据库中做前缀等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)