如何从NCBI导出GBFF和FASTA格式序列

如何从NCBI导出GBFF和FASTA格式序列,第1张

进入NCBI主页,选择Nucleotide数据库

在Nucleotide数据库的检索框中输入甘油醛-3-磷酸脱氢酶基因的基因名(GAPDH)或者基因的GenBank号:X026621。点击搜索。在右边Top Organisms中选择物种来源,点More可以显示更多隐藏选项

选择所需要的物种信息

GenBank会根据设定的检索条件得出相应结果,选择所需要的序列

点击相应序列打开详序列的细信息,默认为GBFF(GenBank Flat File)格式文件。主要包括以下三部分组成:第一部分:描述符,其中包含了关于整个记录的信息;第二部分:特征表,包含了注释这一记录的特性;第三部分:核酸序列本身;在最后一行以“// ”结尾

在这里也可以选择FASTA格式。

FASTA格式又称Pearson 格式

特点:最常用、最简单的序列注释格式

命名规则:

1、以大于号“>"起始

2、 标题行(a single-line description) 位于文件的第一行

3、 序列行随后,序列行中不允许有空间,每行文字不超 过80个字符

4、组成序列信息字符串的符号应为IUB/IUPAC(International Union Of Pure And Applied Chemistry)核苷酸或氨基酸的符号

5、核苷酸字符大小写均可,氨基酸字符应大写

6、"-"单个连字符表示一个空位 “gap”

7、序列中不允许有数字、不明确的核苷酸用N表示,氨基酸用X表示

8、 氨基酸序列中“”表示终止

导出序列时点击Send to

在d出的窗口选择文件单选按钮

在下拉框中选择你需要的文件格式

点击创建文件即可开始下载,下载后的文件可以通过任意文本编辑软件打开。由于NCBI上的文件采用的是Unix/Linux文本格式,而Unix系统里,每行结尾只有“<换行>”,即“\n”;但Windows系统里面,每行结尾是“<换行><回车>”,即“\n\r”,在用记事本等软件打开时每行结尾有一个黑方框,这里只需用兼容Unix/Linux文本格式的编辑器打开即可

数据库是从收录范围和整合程度来判断的。

爱思唯尔期刊全文数据库和NCBI这两个数据库收录的学科范围不同,关键看你想要检索的目的。

爱思唯尔期刊全文数据库收录的是爱思唯尔公司出版的约3000种期刊全文,学科范围为综合性的,包括科技、生物医药及社会科学等。

NCBI 是美国国家生物技术信息中心(National Center for Biotechnology Information)的数据库,NCBI首先创建GenBank数据库,在重点开发GenBank的同时,又于1991年开发了Entrez 数据库检索系统。该系统整合了GenBank、EMBL、PIR和SWISS-PROT等数据库的序列信息以及MEDLINE有关序列的文献信息,并通过相关链接,将他们有机地结合在一起。NCBI还提供了其它数据库,包括在线人类孟德尔遗传(OMIM)、三维蛋白结构的分子模型数据库(MMDB)、人类基因序列集成(UniGene)、人类基因组基因图谱(GMHG)、生物门类(Taxonomy) 等数据库。

一) 按对信息收录的学科范围划分

1综合性数据库所收录信息覆盖学科范围广,涉及多门学科,检索范围广泛。如Web of

Science、中国知网(CNKI)、万方数据知识服务平台等。

2专业性数据库所收录信息仅展于某一学科领城,专业性强,用于检索特定专业文献。

如PubMed/MEDLINE、CA 和中国生物医学文献数据库Chinese BioMedial Literature Database,

以下简称CBM )等。

3专题性数据库收录信息仅限于某一特定对象或专题,适用于专题检索。如中国药物专利数据库、GenBank( 核酸序列数据库)等。

(二) 按收录信息内容的类型不同划分

1文献型数据库( literature database) 是指以各类型文献为内容的数据库,包括书目数据库( bibliographic database )和全文数据库(full-text database )。

书目数据库是指存储次文献信息的数据库,包括题录数据库、文摘数据库、目录数据库等,是信息检索最常用的数据库。为检索者提供文献出处,检索结果是文献的线索而非原文。

如中国生物医学文献数据库(CBM )、MEDLINE 等。

全文数据库是存储文献全文的数据库,包括图书全文数据库、期刊全文数据库、学位论文全文库等,是信息检索中最受欢迎的数据库。如书生之家数字图书馆、超数字图书馆CNKI、万方数据知识服务平台等都拥有不同类型文献的全文数据库。

2数值型数据库( numerical database ) 是存就有关科研数据、教们,包括各种统计教据、实验数据、临床检验数据等数值型信息的数据库。如美国国医学图书编制的化学物质毒性数据库RTECS,包含了10 万多种化学物质的急慢性毒理实验数据。

3事实型数据库( fact database ) 也称指南数据库( directory database ),主要存储某种具体事实、知识数据的非文献信息源的一般参考性、指示性资料信息,每个条目都是对一个事实确切、完整的描述。如人物数据库、机构名录数据库、产品或商品信息数据库以及指南库、术语数据库等。如美国医生数据咨询库PDQ( Physician Data Query ),为医生提供肿瘤诊断、治疗、预后、临床研究等详细资料,相当于一部有关肿瘤的百科全书。

4图像数据库( image database) 是指以图像、图面、图形等为信息主体数据集合。如美国国立医学图书馆( NLM )的可视人计划数据库( the visible human project)和哈佛大学医学院的全脑图谱数据库(the whole brain atlas )等。

5多媒体数据库( multimedia database) 是存储数值、文字、表格、图形、图像、声音等多种媒体信息的数据库,如NLM 的医学史数据库( history of medcine )。

打开新浪新闻

回到首页 查看更多精彩

打开新浪新闻,阅读体验更佳

相关视频

中国货轮抵达巴西,巴西人民围观惊呆!

505249次播放

00:35

国务院联防联控机制:接下来所有医疗机构都要接诊阳性患者……

235695次播放

00:05

终于碰到个关门的了

5602849次播放

00:16

大家都在看

人社局回复感染后居家薪资怎么算

583万

钟南山回应新冠后遗症

569万

把方舱医院升级改造成亚定点医院

474万

保定:感染者确实不少 秩序正恢复

400万

所有医疗机构都要接诊新冠阳性患者

386万

深夜看球吃泡面有多爽

381万

查看全部实时热点

相关新闻

更多

告别!江西籍巨星陨落

都市现场

再熬2天,3生肖财路畅通,大发横财,注定大富大贵

迪迪说体育

独家!深圳突放大招:可延期!

21财闻汇

江西两地任免一批领导干部

江西发布

推荐阅读

更多

王大陆蔡卓宜公开恋情 经纪人回应目前感情稳定

邓伦被曝傍上富二代 与顾家家居千金恋爱中

1娱乐红闪闪

最水金童!踢球脏,喊他滚回西班牙当王室赘婿,别踢球了?

7新氧医美App

上午9点,国足新帅曝光!足协提供1063万年薪,换李霄鹏冲世界杯

33小贤爱足球

再见姆巴佩!皇马王炸签约达成,7200万买16岁天才,未来头牌已定

2视水见行

俄军包围15000多乌军,却发现大量外国雇佣兵?美国态度变了

409兵之佳

27岁女歌手突然失踪,3天后竟在废车后备箱中被发现!尸体被塞进桶中……

4英国报姐

詹俊:或许荷兰实力不如2014年,但全队上下都会为范加尔拼尽所有

6直播吧

世界杯这场球有疑点!教练赛前分钱,让太太团留宿,队长罚点脚软

1三十年莱斯特城球迷

竞争太激烈!皇马当红天才帝星惨遭主帅蒂特冷落 沦为世界杯边缘人

1零度眼看球2018

多门海马斯抵达前线,数万乌军通信信号全部消失!大战终究要来了

7深度军事内参

谷爱凌男友身高1米93,全家都是运动员!基因太强,下一代无解

7一只眼体育

张天爱长肉了!紧身裙包裹下超级有料,不愧是风情万种的代名词

7背锅少女伊云斯

李铁被带走后,里皮首次发声!直戳中国足球弊病:主教练更像傀儡

574吴权林

巴西队吃牛排被骂炫富:国内有5千万人挨饿!国脚回击:少管闲事

36三十年莱斯特城球迷

S家族风波升级!小S丈夫被曝上海养多位情人,私生子如今已3岁

2叶师傅看八卦-

范加尔:阿根廷丢球后梅西不参与比赛 这给我们机会

417新浪体育

10胜2负!西部第一!全联盟天赋最强球队,天赋异禀果然非同一般

1康泳哥

5年15亿美元的超级大合同,买的NBA版权,现在来看赔了吗?

34体坛哈士奇

天亮了!黑哨被撵出世界杯,乌拉圭因他出局,国足碰他基本没赢过

9三十年莱斯特城球迷

视频 直播 美图 博客 新浪 政务 搞笑 八卦 情感 旅游 佛学 众测

首页 导航 反馈 登录

Sinacn(京ICP0000007) 2022-12-09 17:16

说说你的看法

0

外文全文数据库有哪些解说如下

AmericanChemicalSociety(美国化学学会,ACS)成立于1876年,现已成为世界上最大的科技协会。ACS的期刊被ISI的JournalCitationReport(JCR)评为:化学领域中,被引用次数最多的期刊。ACS现有63种期刊(其中有19种期刊已停刊),分为25个主题组,总共大约有300万页信息。内容涵盖以下领域:生化研究方法、药物化学、有机化学、普通化学、环境科学、材料学、植物学、毒物学、食品科学、物理化学、环境工程学、工程化学、应用化学、分子生物化学、分析化学、无机与原子能化学、资料系统计算机科学、学科应用、科学训练、燃料与能源、药理与制药学、微生物应用生物科技、聚合物、农业学。最早可回溯至1879年。ACS电子期刊数据库的主要特色:除具有一般的检索、浏览等功能外,还可在第一时间内查阅到被作者授权发布、尚未正式出版的最新文章(ArticlesASAPsm);用户也可定制E-mail通知服务,以了解最新的文章收录情况;ACS的ArticleReferences可直接链接到ChemicalAbstractsServices(CAS)的资料记录,也可与PubMed、Medline、GenBank、ProteinDataBank等数据库相链接;具有增强图形功能,含3D彩色分子结构图、动画、图表等;全文具有HTML和PDF格式可供选择。我馆已订购ACS41种期刊、ACS教育和参考内容订购包、ACSNews、EducationandReferencePackage。

以上就是关于如何从NCBI导出GBFF和FASTA格式序列全部的内容,包括:如何从NCBI导出GBFF和FASTA格式序列、爱思唯尔期刊全文数据库和NCBI哪个强大、头像数据库属于数据库指南数据库数值数据库哪些属于非文献型数据库等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9455488.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-28
下一篇 2023-04-28

发表评论

登录后才能评论

评论列表(0条)

保存