如何揭开长非编码RNA的神秘面纱

如何揭开长非编码RNA的神秘面纱,第1张

生物通报道:长非编码RNA(lncRNA)长达两百个核苷酸以上的转录本,但并不编码任何蛋白质。尽管如此,长非编码RNA在不同组织和发育阶段的表达依然具有特异性,说明lncRNA的调控具有重要的生物学意义。细胞中绝大多数lncRNA(也称lincRNA)位于细胞核,它们对应的DNA区域有的与蛋白编码基因重叠,有的位于基因间或者内含子中。

为何细胞不惜耗费能量对这些非编码RNA的表达和定位进行严格调控呢?这些RNA分子究竟有何功能?RNA测序技术的发展使人们得以初窥这一神秘的分子,现在lncRNA的许多相关信息都可以在新数据库中查到,例如Broad研究所、哈佛大学和麻省理工共同开发的Human Body Map lincRNAs catalog。不过现在人们了解到的lncRNA只是冰山一角,还有大量lncRNA的功能有待科学家们去探寻。

lncRNA研究工具

现在lncRNA研究面临的一个主要挑战是,研究工具还在不断开发和改进中,其中包括设计带有不同lncRNA检测探针的芯片。安捷伦公司的SurePrint G3 Gene Expression v2 microarray就是其中之一,该芯片的探针设计不仅参照主要公共数据库中的mRNA,还参照了Broad研究所开发的lincRNA和TUCP(transcripts of uncertain coding potential)数据库,可以同时检测编码RNA和非编码RNA。据安捷伦公司基因表达产品经理Corinna Nunn介绍,lncRNA的表达水平比编码RNA低,“因此芯片的动态范围宽很重要,这样才能够保证检测到表达水平较低的基因。”

Affymetrix也推出了新版人类全转录本表达谱芯片GeneChip® Gene 20 ST Arrays,能够在一张芯片上同时检测mRNA和lincRNA。该芯片的设计结合了多个数据库资源,包括RefSeq、Ensemble、Broad研究所的Human Body Map lincRNAs和TUCP catalog。 “我们的超高密度芯片具有独特的探针,能够检测每个转录本各外显子上的多个位点,确保最大程度的捕捉相关生物学信息,” Affymetrix公司的Tsetska Takova说。生物通 主页:>

找到“NCBI Reference Sequences (RefSeq)”,它分为几个板块,第一个“mRNA and Protein

”区可以让我们找到连续的编码 mRNA 序列和蛋白序列。在 mRNA and Protein下面有两个序列代码(中间划有一个箭头) ,这代表了

mRNA序列和蛋白序列。

相关扩展:

NCBI (National Center for Biotechnology Information[1] )是指美国国立生物技术信息中心。理解自然无声但精妙的关于生命细胞的语言是现代分子生物学的要求。通过只有四个字母来代表DNA化学亚基的字母表,出现了生命过程的语法,其最复杂形式就是人类。阐明和使用这些字母来组成新的“单词和短语”是分子生物学领域的中心焦点。数目巨大的分子数据和这些数据的隐秘而精细的模式使得计算机化的数据库和分析方法成为绝对的必须。挑战在于发现新的手段去处理这些数据的容量和复杂性,并且为研究人员提供更好的便利来获得分析和计算的工具,以便推动对我们遗传之物和其在健康和疾病中角色的理解

如何确定基因的内含子和外显子序列及基因结构图

1、首先输入基因的完整学名,找到与基因相关的cDNA序列在这一cRNA序列的解说信息里,就已经有各外显子的分节

2、将该cDNA输入Blast进行序列比对,就可以找到其每一个外显子所对应的染色体位置,这些信息就显示了所有的外显子处于外显子两端的序列就是内含子

3、如你需要完整的基因序列,需要在blast中选择others这个数据库,然后查找相关的Bac质粒中含有你完整基因的文件,在其中找到你所需的信息

在NCBI主页输入要查找的miRNA的名称,all database中选择GENE;在搜索结果中选择目的miRNA,在NCBI reference sequences(RefSeq)栏中点击目的miRNA的ID号即转到序列,还可以通过链接到UCSC、miRBase查找

事实上,在NCBI有很多种办法可以确定某个基因的外显子或者内含子,当然还有UTR区域。今天我们来介绍NCBI的其中一个使用软件Splign来在NCBI上找到一个基因的外显子和内含子。 *** 作步骤如下:

1在Gene数据库,填入基因名HNF-4,我一般的话习惯叫Symbol,每个基因都有个Symbol,即基因名。

2我们来mouse的HNF4基因来作为今天的例子。Symbol会随着版本的升级而变化,当然,以前使用过的基因名也会保留着。而Symbol会对应一个GeneID,无论Symbol如何改变,GeneID是唯一的。这个ID是非常重要的。在这个页面,我们将看到HNF4基因的结构图,从图中给出的信息可以看出,HNF4基因有10个外显子。蓝色部分是UTR区,显示在5’端有一小段序列和3’端有一大段序列是UTR。

3在HNF-4基因的RefSeq区域,我们将可以看到这个基因的参考序列,有mRNA和基因组的。这个区域不一定每个基因都有。NM_开头的序列都是参考序列。

4接下来我们进入Splign的online界面,你可以通过mRNA和基因组的Accession或是它们Fasta格式的序列进行对比,要注意基因组的序列不要太长。推荐直接在下拉框选项里选择,一般常用的生物都在。

5结果一目了然,10个外显子,而且还显示mRNA以及对应的基因组比对的序列,并且还可以知道某个外显子在mRNA序列上的区域。就连UTR区的序列也知道了。

不同的数据库有不同的侧重点。你这个基因是以下该细菌的一个基因,这里有这个菌种全序列数据库:

>

以上就是关于如何揭开长非编码RNA的神秘面纱全部的内容,包括:如何揭开长非编码RNA的神秘面纱、如何在NCBI中查找某种蛋白的mRNA序列、如何确定基因的内含子和外显子序列及基因结构图等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/10169817.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-06
下一篇 2023-05-06

发表评论

登录后才能评论

评论列表(0条)

保存