如何从UCSC数据库中得到GTF注释文件

如何从UCSC数据库中得到GTF注释文件,第1张

For tRNA/rRNA:

Select "All Tables" from the group drop-down list

Select the "rmsk" table from the table drop-down list

Choose "GTF" as the output format

Type a filename (eg "rRNAtRNAgtf") in "output file" so your browser downloads the

result

Click "create" next to filter

Next to "repClass," type rRNA

Next to free-form query, select "OR" and type repClass = "tRNA"

Click submit on that page, then get output on the main page

For chrM genes:

Select "All Tables" from the group drop-down list

Select the "knownGene" table from the table drop-down list

Choose "GTF" as the output format

Type a filename (eg "chrMgtf") in "output file" so your browser downloads the result

Click "create" next to filter

Next to "chrom," type chrM

Click submit on that page, then get output on the main page

1芯片原始数据分析如果你的芯片平台常见的话 可以试试国内一切常见的自动化分析平台;

2你说miRNA与lncRNA预测的话,方法太多了,比如DIANA,starbase,RegRNA,microinspector等等,不过这些数据库预测的结果也都是基于一定的机制,也有是高通量之后的数据,不过个人认为这种预测是为你去解释现象而不是发现现象!

生信菜鸟团上大学之后,我上网找资料时发现的第一个博客就是生信菜鸟团,里面包罗万象,涵盖很多方面(初次发现时,就感觉自己进入了新的天地)rabbit gao's blog  我超喜欢这个师兄的博客里面的笔记,很直观,尤其是python那部分。他是以代码的形式展示内容。沈梦圆博客梦圆师姐,和我一样喜欢用熊猫头像,她的博客也是刚刚建立不长时间。师姐的文笔很赞,看里面博文相信对你有帮助的。生信日志|鸣一道鸣一道师兄的博客我比较喜欢的是R做图那一块plob这个我比较少看,不过内容也不错,我后续再写上这个博客的描述。陈连福博客 听说连福老师有开培训班,实力自然也不差。糗世界←欢迎来到糗糗的世界糗世界主要包括:序列比对与NGS  R/bioconductorcircos教程,其中糗世界关于R和bioconductor以及NGS的归纳总结特别详尽生信客部落生信客部落是我自己的博客,刚建不久(201693建的),我目前在准备考研,打理的时间不多。但相信是一只潜力股,有提升的空间。也欢迎博友们交换 "友情链接"hope博客  hope 他(她)有一篇关于生物信息学在线工具的总结,我特别喜欢科研动力“endnote使用宝典”,专注写endnote相关的内容。(注:endnote 是文献管理的软件,插入引用文献的神器)biochen生物伯臣生物里也蛮多归纳整理的Bob's Blog   bob这位兄弟的博客我接触不多,我后续补上描述论坛(包括生信论坛和其他一些相关的网站):生信技能树生信技能树前面那个师兄有详细描述过。我也亲眼见证了它从无到有的过程,看着生信技能树感觉特别亲切,感觉就像自家的孩子一样。我自己由于准备考研和书写毕业论文的事情,在生信技能树建设的参与度不高。总之,好喜欢生物信息学天空内容超全的一个生信论坛丁香园(生信板块)丁香园,就不解释了,一个国内最成功的论坛之一。医学生基本都知道的一个论坛。小木虫小木虫,里面蛮多资源的,也是国内最成功的论坛之一生物统计家园描述待输入基因堂描述待输入biostars这是一个生信问答网站生信刷题网站ROSALIND | About 这个是一个生物信息的刷题网站,超多实战题(纯英文,既提高英语水平,又训练了自己的实战能力,何乐而不为)。实战走起生物信息学在线工具网站生信客部落生物信息工具整合(包含在线工具与离线工具)–更新中这里面包含了一些生物信息学可视化工具,包含在线的工具和一些离线的可视化工具,由于目前个人水平有限,所以还有待继续完善

BSgenomeHsapiensUCSChg38是生信技能树TCGA课程中讲到的需要使用的一个R包,所以我装了一个,发现这个包十分不好安装,现记录过程如下,方便后续使用。

再次安装失败

安装成功!

是的,数据集可以挑选一部分生信数据进行分析。在生物信息学中,数据集通常包括大量的生物学数据,如基因组序列、转录组数据、蛋白质组数据等。这些数据集可能包含大量的冗余信息,或者可能与我们的研究问题无关。因此,为了更好地分析生信数据,需要对数据集进行筛选和挑选。

一种常见的数据挑选方法是基于实验设计或研究问题的需求,选择与问题相关的数据进行分析。例如,在研究某种疾病的基因表达调控机制时,可以选择与该疾病相关的转录组数据进行分析,而过滤掉与该疾病无关的数据。此外,还可以使用统计学方法,如主成分分析、聚类分析等方法,对数据集进行筛选和挑选,以提取最具代表性的数据集。

总之,数据集可以根据研究问题的需求进行筛选和挑选,以提高生信数据的分析效率和精度。

以上就是关于如何从UCSC数据库中得到GTF注释文件全部的内容,包括:如何从UCSC数据库中得到GTF注释文件、如何ucsc查询lncrna是否有polya、学习生物信息学有哪些比较好的网站或论坛等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9684266.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-30
下一篇 2023-04-30

发表评论

登录后才能评论

评论列表(0条)

保存