ncbi使用教程
AAA3381664
2016-11-04 19054人看过
NCBI (National Center for Biotechnology Information)是指美国国立生物技术信息中心。理解自然无声但精妙的关于生命细胞的语言是现代分子生物学的要求。通过只有四个字母来代表DNA化学亚基的字母表,出现了生命过程的语法,其最复杂形式就是人类。阐明和使用这些字母来组成新的“单词和短语”是分子生物学领域的中心焦点。数目巨大的分子数据和这些数据的隐秘而精细的模式使得计算机化的数据库和分析方法成为绝对的必须。挑战在于发现新的手段去处理这些数据的容量和复杂性,并且为研究人员提供更好的便利来获得分析和计算的工具,以便推动对我们遗传之物和其在健康和疾病中角色的理解。在生物学研究中,NCBI提供了大量的生物信息分析工具以及文献。所以学号检索方法是进入新生物学领域的必备技能。Blast工具、PubMed文献数据库等。
工具/原料
浏览器 NCBI网址
方法/步骤
1/9 分步阅读
首先进入NCBI主页。
Map view演示,主要是找到相关基因在染色体上的位置,以人类IL-6基因为例。
点击Map View
查看剩余1张图
2/9
选择物种,点击Go;
设置filter,过滤信息;
点击Genes seq查询序列
查看剩余4张图
3/9
最后进入序列下载页面,可以直接下载。可以选择多种格式,一般选择fasta。
查看剩余2张图
4/9
通过clone查询相关基因的cDNA序列
选择clone数据库,search基因描述。
查看剩余2张图
5/9
对基因的蛋白质序列和mRNA查询。
查看剩余1张图
6/9
也可对序列进行查询。基因组展示。
查看剩余1张图
7/9
也可以查询序列信息。
查看剩余1张图
8/9
查询已知引物,通过probe数据库搜索。
查看剩余1张图
9/9
同源性比对blast。有多种比对方式。DNA,RNA,Protein等比对模式,排列越高表示同源性越强。也可以进行引物比对。
查看剩余2张图
注意事项
简单演示仍需深入了解
21世纪是生物科学的世纪
软件 NCBI
编辑于2016-11-04,内容仅供参考并受版权保护
赞 踩分享
bsci认证机构哪家好
NCBI 分类学数据库(taxonomy database)不是分类学或系统发育信息的信息源(primary source),而且也没有自己的一套完整的分类学系统,相反它只是努力整合各种各样来源的系统发育和分类学的知识,包括发表的文献、基于网络的数据库、序列提交者的建议以及来自NCBI 外部的分类学专家。因此NCBI 的分类学数据库不是一个系统发育或分类学的“专家数据库”(Wheeler et al, 2000)。
获取序列所对应的分类学信息有两种方法。
一种方法,从NCBI 网站下载gi与taxid 对应表,在Taxonomy 数据库的FTP 地址下载。这个目录下有多个压缩文件,其中针对Windows *** 作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_protdmpgz 和gi_taxid_nucldmpgz 文件。这两个文件都只有两列,左边为gi 号,右边为Taxid。由于这些文件非常大,因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移,这两个文件会越来越大,不过速度不会是指数增长的,并且在美国东部时间的每个星期一2:00 am NCBI 会对其进行更新。
对于Windows 用户还有一个文件称为taxdumpzip 文件。文件解压缩后包括1 个prt 文件和6 个dmp 文件。Gencodedmp 文件保存有不同的密码子表,与同目录的gcprt 联合使用;mergeddmp 是保存有合并的taxid 号的对应表;nodesdmp 是结点信息;divisiondmp 是较大的几个分类;namesdmp 结点名称信息,每个id 对应多行。这些数据被Phylogenie 软件包中的blammer 程序用于构建进化树。
利用ftp 地址的连接利用>
在NCBI主页上方search栏左边有一个database选择框,点击下拉三角形选择nucleotide(如图红框)在search栏输入基因名搜索即可以人的orc1基因为例,在搜索结果中选择mRNA和complete cds序列的结果都可以,如下点击进入序
这个问题涉及到NCBI的核心价值——数据共享。从NCBI创建之初她就是为用户”下载“数据而存在。历经近30年的发展,其提供的数据共享的方式也经历了诸多的改变。下面以提供数据共享的技术方式来逐一陈述:
1 FTP
FTP是File Transfer Protocol(文件传输协议)的英文简称。在互联网形成之初,非常重要的大文件传输格式。目前NCBI的大文件传输,甚至是整个NCBI网站的数据都可以用这种方式获得。网址为ftp://ftpncbinlmnihgov/不过要用好这些数据,你需要同时兼备生物学和计算机科学(基本)知识。
2 网页
当然绝大多数生物学家并不需要进行批量数据分析,知识要找到与自己课题相关的数据。NCBI提供了基于网页的查询检索系统。之所以称之为系统是因为其中包含了NCBI所有提供服务的数据库,该系统有一个统一的查询界面,成为Entrez。其语法和规则在查询不同数据库是基本相似,知识需要简单了解相应数据库的特殊字符即可。例如,查询GEO数据库时,只查询dataset数据可以使用[DataSet Type]关键字,但是该关键字在PUBMED并不适用。
3web服务
web服务在生物信息学和计算机科学中的定义有很大差别,这里特制计算机科学中的web服务。NCBI基于entrez提供了web service服务,用户在自己的程序中调用代码获取数据。主要是eUtils(>
因此NCBI 的分类学数据库不是一个系统发育或分类学的“专家数据库”(Wheeler et al, 2000)。获取序列所对应的分类学信息有两种方法。一种方法,从NCBI 网站下载gi与taxid 对应表,在Taxonomy 数据库的FTP 地址下载。这个目录下有多个压缩文件,其中针对Windows *** 作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_protdmpgz 和gi_taxid_nucldmpgz 文件。这两个文件都只有两列,左边为gi 号,右边为Taxid。由于这些文件非常大,因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移,这两个文件会越来越大,不过速度不会是指数增长的,并且在美国东部时间的每个星期一2:00 am NCBI 会对其进行更新。对于Windows 用户还有一个文件称为taxdumpzip 文件。文件解压缩后包括1 个prt 文件和6 个dmp 文件。Gencodedmp 文件保存有不同的密码子表,与同目录的gcprt 联合使用;mergeddmp 是保存有合并的taxid 号的对应表;nodesdmp 是结点信息;divisiondmp 是较大的几个分类;namesdmp 结点名称信息,每个id 对应多行。这些数据被Phylogenie 软件包中的blammer 程序用于构建进化树。利用ftp 地址的连接利用>
一级数据库(Primary Databases)
1、直接来源于测序工作者或实验室研究人员
2、数据库工作人员组织数据但不添加任何信息
例如:GenBank
衍生数据库(Derivative Databases)
1、人工校正的数据库
例如: RefSeq
2、计算机校正的数据库
例如: UniGene
Endnote X2中左下角数据库栏,有个“PubMed(NLM)”
它里面提供远程的搜索,你用次库搜的结果一小部分是免费的。
是有些杂志为吸引读者继续读而故意免费的。
NCBI库很大,它不在Endnote X2中,但是PubMed是NCBI中最大的一个免费量分支库。
换句话说,你用的PubMed搜的东西已经是NCBI免费的资料了。
楼主,切记,天下没有免费的午餐。。。。。
Endnote
X2中左下角数据库栏,有个“PubMed(NLM)”
它里面提供远程的搜索,你用次库搜的结果一小部分是免费的。
是有些杂志为吸引读者继续读而故意免费的。
NCBI库很大,它不在Endnote
X2中,但是PubMed是NCBI中最大的一个免费量分支库。
换句话说,你用的PubMed搜的东西已经是NCBI免费的资料了。
楼主,切记,天下没有免费的午餐。。。。。
以上就是关于ncbi怎么用全部的内容,包括:ncbi怎么用、谁知道怎样在NCBI中找数据库、ncbi数据库怎么查找基因序列等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)