NCBI转录组数据能否直接下载FASTA格式序列，windows 32 *** 作系统无法将下载的SRA文件转换成FASTQ文件。_工具

方法/步骤

进入NCBI主页，选择Nucleotide数据库

在Nucleotide数据库的检索框中输入甘油醛-3-磷酸脱氢酶基因的基因名（GAPDH）或者基因的GenBank号：X026621。点击搜索。在右边Top Organisms中选择物种来源，点More可以显示更多隐藏选项

选择所需要的物种信息

GenBank会根据设定的检索条件得出相应结果，选择所需要的序列

点击相应序列打开详序列的细信息，默认为GBFF(GenBank Flat File)格式文件。主要包括以下三部分组成：第一部分：描述符，其中包含了关于整个记录的信息；第二部分：特征表，包含了注释这一记录的特性；第三部分：核酸序列本身；在最后一行以“// ”结尾

在这里也可以选择FASTA格式。

FASTA格式又称Pearson 格式

特点：最常用、最简单的序列注释格式

命名规则：

1、以大于号“>"起始

2、标题行(a single-line description) 位于文件的第一行

3、序列行随后，序列行中不允许有空间，每行文字不超过80个字符

4、组成序列信息字符串的符号应为IUB/IUPAC（International Union Of Pure And Applied Chemistry）核苷酸或氨基酸的符号

5、核苷酸字符大小写均可，氨基酸字符应大写

6、"-"单个连字符表示一个空位 “gap”

7、序列中不允许有数字、不明确的核苷酸用N表示，氨基酸用X表示

8、氨基酸序列中“”表示终止

导出序列时点击Send to

在d出的窗口选择文件单选按钮

在下拉框中选择你需要的文件格式

点击创建文件即可开始下载，下载后的文件可以通过任意文本编辑软件打开。由于NCBI上的文件采用的是Unix/Linux文本格式，而Unix系统里，每行结尾只有“<换行>”，即“\n”；但Windows系统里面，每行结尾是“<换行><回车>”，即“\n\r”，在用记事本等软件打开时每行结尾有一个黑方框，这里只需用兼容Unix/Linux文本格式的编辑器打开即可

NCBI 分类学数据库（taxonomy database）不是分类学或系统发育信息的信息源（primary source），而且也没有自己的一套完整的分类学系统，相反它只是努力整合各种各样来源的系统发育和分类学的知识，包括发表的文献、基于网络的数据库、序列提交者的建议以及来自NCBI 外部的分类学专家。因此NCBI 的分类学数据库不是一个系统发育或分类学的“专家数据库”（Wheeler et al, 2000）。

获取序列所对应的分类学信息有两种方法。

一种方法，从NCBI 网站下载gi与taxid 对应表，在Taxonomy 数据库的FTP 地址下载。这个目录下有多个压缩文件，其中针对Windows *** 作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_protdmpgz 和gi_taxid_nucldmpgz 文件。这两个文件都只有两列，左边为gi 号，右边为Taxid。由于这些文件非常大，因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移，这两个文件会越来越大，不过速度不会是指数增长的，并且在美国东部时间的每个星期一2：00 am NCBI 会对其进行更新。

对于Windows 用户还有一个文件称为taxdumpzip 文件。文件解压缩后包括1 个prt 文件和6 个dmp 文件。Gencodedmp 文件保存有不同的密码子表，与同目录的gcprt 联合使用；mergeddmp 是保存有合并的taxid 号的对应表；nodesdmp 是结点信息；divisiondmp 是较大的几个分类；namesdmp 结点名称信息，每个id 对应多行。这些数据被Phylogenie 软件包中的blammer 程序用于构建进化树。

利用ftp 地址的连接利用>

sqlserver 和 mysql都是免费的，下个回去你爱怎么弄就怎么弄，弄坏了就卸了重装（能弄坏LZ也算NB人物）

LZ可以先INSERT增加进去嘛，好歹增删改查咱都要练是吧，，弄几个表多表联接查询都能练了，还搞什么别人的数据库。没必要

你想下网上到处都是，网上使用ASP+Access数据库制作的网站中的Access怎样下载吧。

1、下载方法比较多，如果网站没有特殊设置，那你可以在地址栏里直接输入数据库名称进行下载，数据库名称可以将网页另存下来以后，分析代码获得，也可以根据网站使用的ASP程序，推测出来。一般使用动易2006版（小型网站比较常用的免费系统）制作的网站，数据库名都是powereasy2006dbf，路径在网站根目录下datebase文件夹下。

2、在大家都使用了一些保护方法，例如将数据库文件后缀改为asp或asa。这样，直接用浏览器就不能下载了。

3、当然也可以使用整站下载工具，将整个网站拉下来，进行分析。

公开人脸数据集

本页面收集到目前为止可以下载到的人脸数据库，可用于训练人脸深度学习模型。

人脸识别

数据库

描述

用途

获取方法

WebFace 10k+人，约500K张非限制场景链接

FaceScrub 530人，约100k张非限制场景链接

YouTube Face 1,595个人 3,425段视频非限制场景、视频链接

LFW 5k+人脸，超过10K张标准的人脸识别数据集链接

MultiPIE 337个人的不同姿态、表情、光照的人脸图像，共750k+人脸图像限制场景人脸识别链接需购买

MegaFace 690k不同的人的1000k人脸图像新的人脸识别评测集合链接

IJB-A 人脸识别，人脸检测链接

CAS-PEAL 1040个人的30k+张人脸图像，主要包含姿态、表情、光照变化限制场景下人脸识别链接

Pubfig 200个人的58k+人脸图像非限制场景下的人脸识别链接

人脸检测

数据库

描述

用途

获取方法

FDDB 2845张中的5171张脸标准人脸检测评测集链接

IJB-A 人脸识别，人脸检测链接

Caltech10k Web Faces 10k+人脸，提供双眼和嘴巴的坐标位置人脸点检测链接

人脸表情

数据库

描述

用途

获取方法

CK+ 137个人的不同人脸表情视频帧正面人脸表情识别链接

人脸年龄

数据库

描述

用途

获取方法

IMDB-WIKI 包含：IMDb中20k+个名人的460k+张和维基百科62k+张, 总共： 523k+张名人年龄、性别链接

Adience 包含2k+个人的26k+张人脸图像人脸性别，人脸年龄段(8组) 链接

CACD2000 2k名人160k张人脸人脸年龄链接

人脸性别

数据库

描述

用途

获取方法

IMDB-WIKI 包含：IMDb中20k+个名人的460k+张和维基百科62k+张, 总共： 523k+张名人年龄、性别链接

Adience 包含2k+个人的26k+张人脸图像人脸性别，人脸年龄段(8组) 链接

人脸关键点检测

数据库

描述

用途

获取方法

数据库描述用途获取方法

人脸其它

数据库

描述

用途

获取方法

CeleBrayA 200k张人脸图像40多种人脸属性人脸属性识别获取方法

GitHub：DeepFace

1、文献党下载器一款资源集成的文献下载平台，几乎整合了所有中外文献数据库资源，覆盖全科以及各种文献类型。整合资源包括知网、万方、维普、SpringerLink、Elsevier（sciencedirect）、Wiley 、Web of Science、PubMed 、EI、ProQuest（国外学位论文）等数据库资源，还有大量的世界知名期刊，如：nature《自然》、science《科学》、CELL《细胞》、PNAS《美国科学院院报》等等。只要有互联网有电脑，在哪里都可以查找下载文献。

2、知网：全球最大的中文数据库。提供中国学术文献、外文文献、学位论文、报纸、会议、年鉴、工具书等各类资源，并提供在线阅读和下载服务。涵盖领域包括：基础科学、文史哲、工程科技、社会科学、农业、经济与管理科学、医药卫生、信息科技等。

3、万方数据库：是由万方数据公司开发的，涵盖期刊、会议纪要、论文、学术成果、学术会议论文的大型网络数据库；也是和中国知网齐名的中国专业的学术数据库。

学科分类：综合，机械，电子电气，计算机/信息科学，能源/动力工程，建筑/土木工程，艺术，社会科学，语言/文学，教育，哲学，政治，生物，材料科学，环境科学，化学/化工，物理，数学。

4、Web of Science是获取全球学术信息的重要数据库。其中以SCIE、SSCI、A&HCI等引文索引数据库，JCR期刊引证报告和ESI基本科学指标享誉全球科技和教育界。Web of Science收录了论文中所引用的参考文献，通过独特的引文索引，用户可以用一篇文章、一个专利号、一篇会议文献、一本期刊或者一本书作为检索词，检索它们的被引用情况，轻松回溯某一研究文献的起源与历史，或者追踪其最新进展；可以越查越广、越查越新、越查越深。

5、Wiley 作为全球最大、最全面的经同行评审的科学、技术、医学和学术研究的在线多学科资源平台之一，Wiley及旗下的子品牌出版了超过500位诺贝尔奖得主的作品。“Wiley Online Library”覆盖了生命科学、健康科学、自然科学、社会与人文科学等全面的学科领域。Wiley Online Library上有1600多种经同行评审的学术期刊，20000本电子图书，170多种在线参考工具书，580多种在线参考书，19种生物学、生命科学和生物医学的实验室指南（Current Protocols），17种化学、光谱和循证医学数据库（Cochrane Library）。

6、Elsevier（sciencedirect）是荷兰一家全球著名的学术期刊出版商，每年出版大量的学术图书和期刊，大部分期刊被SCI、SSCI、EI收录，是世界上公认的高品位学术期刊。scienceDirect是爱思唯尔公司的全文数据库平台，是全球最大的科学、技术与医学全文电子资源数据库，提供2500余种学术期刊以及37000余种图书的全文内容。包括全球影响力极高的CELL《细胞杂志》、THE LANCET《柳叶刀杂志》等。

7、SpringerLink是全球最大的在线科学、技术和医学(STM)领域学术资源平台。Springer 的电子图书数据库包括各种的Springer图书产品，如专著、教科书、手册、地图集、参考工具书、丛书等。具体学科涉及：数学、物理与天文学、化学、生命科学、医学、工程学、计算机科学、环境科学、地球科学、经济学、法律。

8、PubMed 是一个免费的搜寻引擎，提供生物医学方面的论文搜寻以及摘要的数据库。它的数据库来源为MEDLINE。其核心主题为医学，但亦包括其他与医学相关的领域，像是护理学或者其他健康学科。PubMed 的资讯并不包括期刊论文的全文，但可提供指向全文提供者（付费或免费）的链接。

以上就是关于NCBI转录组数据能否直接下载FASTA格式序列，windows 32 *** 作系统无法将下载的SRA文件转换成FASTQ文件。全部的内容，包括:NCBI转录组数据能否直接下载FASTA格式序列，windows 32 *** 作系统无法将下载的SRA文件转换成FASTQ文件。、谁知道怎样在NCBI中找数据库、在哪里能找到供学生练习用的数据库等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/sjk/9810771.html

NCBI转录组数据能否直接下载FASTA格式序列，windows 32 *** 作系统无法将下载的SRA文件转换成FASTQ文件。

发表评论

评论列表（0条）