美国国家生物技术信息中心(NCBI)的主要工作是什么

美国国家生物技术信息中心(NCBI)的主要工作是什么,第1张

(NCBI维护的数据库)NCBI的主要工作是在分子水平上应用数学和计算机科学的方法研究基础生物,医学问题。为科学界开发,维护和分享一系列的生物信息数据库;开发和促进生物信息学数据库,数据的储存,交换以及生物学命名规则的标准化。

学会看帮助信息

+函数名 ,比如 seq

seq(2,20,2)意思是从2(第一个参数)开始,每次加2(第三个参数),一只到大于20停止

rep(2,10)意思是2重复10次

rep(seq(2,20,2), rep(2,10))看起来比较复杂,看下面这个比较简单:

rep(1:4, c(2,1,2,1))

1、2、3、4四个数(1:4就是1、2、3、4的意思),第一个数重复2次,第二个重复1次,第三个重复2次,第四个重复1次,一一对应,按顺序的

如果rep(a,b)中的a、b两个参数的个数不一样就会报错了

你进了NCBI的blast页面之后,粘贴进去序列,下面的program selection 选择第三个。结果中有一个“Gallus gallus”,即是家鸡了(应该是从上面数第二个结果)。

知道了名字,在搜索框里输入后可以看到相应的搜索结果,然后点击进去,有个“MIM”(在线孟德尔遗传)就可以看到它的功能。

ORF是开放阅读框,指的是mRNA上编码氨基酸的那段序列,从AUG开始,直到终止子,但是不包括终止子。ORF的数据在进入NCBI主页的右下侧一个叫ORFfinder的超链接里,点击进去后输入相应序列的mRNA序列,然后再点击ORF find就可以预测处它的ORF,但是往往会有很多结果,一般来说第一个结果是真实的,其余的都是假阳性的。

fasta格式指的就是一个大于号开头,后面跟上这段序列的描述,然后另起一行就是数列,给你个例子你就知道了,如下,这就是人类USF1 mRNA的fasta格式

>gi|46877100|ref|NM_0071223| Homo sapiens upstream transcription factor 1 (USF1), transcript variant 1, mRNA

AACATGGCCGCGGGCTGGAAGTGCGCATGAGCAGCTGTCTATGGAGATACCTAGGCCGGGAGAGGGAGAA

CACAGTTGGAGAAAATCGGCAGCTGAGACGGCCTTGGCCGGACTTAGCACTCAGGCCTGTGAATCAGGAG

ATACAAAGACCTCCAAAAAAGGACCAGTTCCTCGGATGTGCCCCCTCACAGAGAGATGAAGGGGCAGCAG

AAAACAGCTGAAACGGAAGAGGGGACAGTGCAGATTCAGGAAGGTGCAGTGGCTACTGGGGAAGACCCAA

CCAGTGTGGCTATTGCCAGCATCCAGTCAGCTGCCACCTTCCCTGACCCCAACGTCAAGTACGTCTTCCG

AACTGAGAATGGGGGCCAGGTGATGTACAGGGTGATCCAGGTGTCTGAGGGGCAGCTGGATGGCCAAACT

GAGGGAACTGGCGCCATCAGTGGCTACCCTGCCACTCAATCCATGACCCAGGCGGTGATCCAGGGTGCTT

TCACCAGTGATGATGCAGTTGACACGGAGGGGACAGCTGCTGAGACGCACTATACTTACTTCCCCAGCAC

GGCAGTGGGAGATGGGGCAGGGGGTACCACATCGGGGAGTACAGCTGCTGTTGTTACTACCCAGGGCTCA

GAGGCACTGCTGGGGCAGGCGACCCCTCCTGGCACTGGTCAATTCTTTGTGATGATGTCACCACAAGAAG

TACTGCAGGGAGGAAGCCAGCGCTCAATTGCCCCTAGGACTCACCCTTATTCCCCGAAGTCAGAAGCTCC

CCGGACGACTCGGGATGAGAAACGCAGGGCTCAGCATAATGAAGTGGAGCGTCGCCGCCGAGACAAGATC

AACAACTGGATCGTGCAGCTCTCCAAGATAATCCCAGACTGCTCTATGGAGAGCACCAAGTCTGGCCAGA

GTAAAGGTGGGATTCTATCCAAAGCTTGTGATTATATCCAGGAGCTTCGGCAGAGTAACCACCGCTTGTC

TGAAGAACTGCAGGGACTTGACCAACTGCAGCTGGACAATGACGTGCTTCGACAACAGGTGGAAGATCTT

AAAAACAAGAATCTGCTGCTTCGAGCTCAGTTGCGGCACCACGGATTAGAGGTCGTCATCAAGAATGACA

GCAACTAACTATGGGGATTCAGGGGCTTTGGGCCCAAGAACTGCAGATAGCCCAGGAGCAACAGCCTAAT

CCCGTGCCCCTTTCCTTCACTGCCCCACTTCTGGCATGGGACAGGGGGAAGTTCAGAAGGTGTGTCCTTG

AACTGAGGCCCTGTGATATGGCGGCCTGCAGTGGTGTGAAACACACAATGTGGACGTGCACTGACAGCCT

TGCCCACCCCCACCATGCAGCCCCTGGGCCCTTGTGCTCCTCTCGCACAATGCATGTGCTGTCTCCATGC

TGGATACTGGACACACTAAACTCTGGGGCTTGTCCTGTGCTTGCTTAGAGTGCCCAGCAGAGGTTTGCTG

ACAGGTGATGCTCTGGCTTGCCCCAGGACTCTGGCACTTCCATTGGTTCTTCCTTTCCCTGGAGCTGAGG

TTTAGATGTGCAACCTGTGGCTCAGGGGAGCAAGCTTACACAAGAAGTGAGGGAAGGATGTTTAGCAGTG

GCTGGTGCCCATGAAGAGGAGATTGGCCAGTGAGAAGCTGAGGCCTATGCAGACATCTCTGGAGCCAGAG

AGAACAACAGGCAGGGGCCCACTTGGGGCCTTCCCCCTTGTGGGGGTCGTTTTTTTTTTTTCTTTTCTTT

TTTTTTTTTTTTTTTTTTTTTTTTTAAGATAAAATTGTTCAAAGCCAAAAAAAAAAAAAAAAAAAAAAAA

AAAAAAAAAAA

这就是fasta格式,你可以以TXT的方式保存,也可以以后缀名为fasta的方式保存,然后以文本文件打开就行了,说白了就是个文本文件呵呵。一般情况下这样就可以了,但是如果用blast2go来做GO分类的话,就必须用fasta来保存,否则该软件不识别。详细的在NCBI上都有的,自己可以去看。

这个问题涉及到NCBI的核心价值——数据共享。从NCBI创建之初她就是为用户”下载“数据而存在。历经近30年的发展,其提供的数据共享的方式也经历了诸多的改变。下面以提供数据共享的技术方式来逐一陈述:

1 FTP

FTP是File Transfer Protocol(文件传输协议)的英文简称。在互联网形成之初,非常重要的大文件传输格式。目前NCBI的大文件传输,甚至是整个NCBI网站的数据都可以用这种方式获得。网址为ftp://ftpncbinlmnihgov/不过要用好这些数据,你需要同时兼备生物学和计算机科学(基本)知识。

2 网页

当然绝大多数生物学家并不需要进行批量数据分析,知识要找到与自己课题相关的数据。NCBI提供了基于网页的查询检索系统。之所以称之为系统是因为其中包含了NCBI所有提供服务的数据库,该系统有一个统一的查询界面,成为Entrez。其语法和规则在查询不同数据库是基本相似,知识需要简单了解相应数据库的特殊字符即可。例如,查询GEO数据库时,只查询dataset数据可以使用[DataSet Type]关键字,但是该关键字在PUBMED并不适用。

3web服务

web服务在生物信息学和计算机科学中的定义有很大差别,这里特制计算机科学中的web服务。NCBI基于entrez提供了web service服务,用户在自己的程序中调用代码获取数据。主要是eUtils(>

1、电脑浏览器百度搜索NCBI,直接点击图示链接进入。

2、下一步打开其中的首页,需要搜索对象并选择跳转。

3、这个时候如果没问题,就继续确定浏览所查询的蛋白质。

4、这样一来等得到相关的结果以后,即可实现要求了。

以上就是关于美国国家生物技术信息中心(NCBI)的主要工作是什么全部的内容,包括:美国国家生物技术信息中心(NCBI)的主要工作是什么、ncbi中geo数据库中rep1和rep2的区别、求高人指教,关于生物信息学中NCBI数据库的blastn的用法.等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9516400.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-29
下一篇 2023-04-29

发表评论

登录后才能评论

评论列表(0条)

保存