NCBI转录组数据能否直接下载FASTA格式序列,windows 32 *** 作系统无法将下载的SRA文件转换成FASTQ文件。

NCBI转录组数据能否直接下载FASTA格式序列,windows 32 *** 作系统无法将下载的SRA文件转换成FASTQ文件。,第1张

方法/步骤

进入NCBI主页,选择Nucleotide数据库

在Nucleotide数据库的检索框中输入甘油醛-3-磷酸脱氢酶基因的基因名(GAPDH)或者基因的GenBank号:X026621。点击搜索。在右边Top Organisms中选择物种来源,点More可以显示更多隐藏选项

选择所需要的物种信息

GenBank会根据设定的检索条件得出相应结果,选择所需要的序列

点击相应序列打开详序列的细信息,默认为GBFF(GenBank Flat File)格式文件。主要包括以下三部分组成:第一部分:描述符,其中包含了关于整个记录的信息;第二部分:特征表,包含了注释这一记录的特性;第三部分:核酸序列本身;在最后一行以“// ”结尾

在这里也可以选择FASTA格式。

FASTA格式又称Pearson 格式

特点:最常用、最简单的序列注释格式

命名规则:

1、以大于号“>"起始

2、 标题行(a single-line description) 位于文件的第一行

3、 序列行随后,序列行中不允许有空间,每行文字不超 过80个字符

4、组成序列信息字符串的符号应为IUB/IUPAC(International Union Of Pure And Applied Chemistry)核苷酸或氨基酸的符号

5、核苷酸字符大小写均可,氨基酸字符应大写

6、"-"单个连字符表示一个空位 “gap”

7、序列中不允许有数字、不明确的核苷酸用N表示,氨基酸用X表示

8、 氨基酸序列中“”表示终止

导出序列时点击Send to

在d出的窗口选择文件单选按钮

在下拉框中选择你需要的文件格式

点击创建文件即可开始下载,下载后的文件可以通过任意文本编辑软件打开。由于NCBI上的文件采用的是Unix/Linux文本格式,而Unix系统里,每行结尾只有“<换行>”,即“\n”;但Windows系统里面,每行结尾是“<换行><回车>”,即“\n\r”,在用记事本等软件打开时每行结尾有一个黑方框,这里只需用兼容Unix/Linux文本格式的编辑器打开即可

NCBI 分类学数据库(taxonomy database)不是分类学或系统发育信息的信息源(primary source),而且也没有自己的一套完整的分类学系统,相反它只是努力整合各种各样来源的系统发育和分类学的知识,包括发表的文献、基于网络的数据库、序列提交者的建议以及来自NCBI 外部的分类学专家。因此NCBI 的分类学数据库不是一个系统发育或分类学的“专家数据库”(Wheeler et al, 2000)。

获取序列所对应的分类学信息有两种方法。

一种方法,从NCBI 网站下载gi与taxid 对应表,在Taxonomy 数据库的FTP 地址下载。这个目录下有多个压缩文件,其中针对Windows *** 作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_protdmpgz 和gi_taxid_nucldmpgz 文件。这两个文件都只有两列,左边为gi 号,右边为Taxid。由于这些文件非常大,因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移,这两个文件会越来越大,不过速度不会是指数增长的,并且在美国东部时间的每个星期一2:00 am NCBI 会对其进行更新。

对于Windows 用户还有一个文件称为taxdumpzip 文件。文件解压缩后包括1 个prt 文件和6 个dmp 文件。Gencodedmp 文件保存有不同的密码子表,与同目录的gcprt 联合使用;mergeddmp 是保存有合并的taxid 号的对应表;nodesdmp 是结点信息;divisiondmp 是较大的几个分类;namesdmp 结点名称信息,每个id 对应多行。这些数据被Phylogenie 软件包中的blammer 程序用于构建进化树。

利用ftp 地址的连接利用>

sqlserver 和 mysql都是免费的,下个回去你爱怎么弄就怎么弄,弄坏了就卸了重装(能弄坏LZ也算NB人物)

LZ可以先INSERT增加进去嘛,好歹增删改查咱都要练是吧,,弄几个表多表联接查询都能练了,还搞什么别人的数据库。没必要

你想下网上到处都是,网上使用ASP+Access数据库制作的网站中的Access怎样下载吧。

1、下载方法比较多,如果网站没有特殊设置,那你可以在地址栏里直接输入数据库名称进行下载,数据库名称可以将网页另存下来以后,分析代码获得,也可以根据网站使用的ASP程序,推测出来。一般使用动易2006版(小型网站比较常用的免费系统)制作的网站,数据库名都是powereasy2006dbf,路径在网站根目录下datebase文件夹下。

2、在大家都使用了一些保护方法,例如将数据库文件后缀改为asp或asa。这样,直接用浏览器就不能下载了。

3、当然也可以使用整站下载工具,将整个网站拉下来,进行分析。

公开人脸数据集

本页面收集到目前为止可以下载到的人脸数据库,可用于训练人脸深度学习模型。

人脸识别

数据库

描述

用途

获取方法

WebFace 10k+人,约500K张 非限制场景 链接

FaceScrub 530人,约100k张 非限制场景 链接

YouTube Face 1,595个人 3,425段视频 非限制场景、视频 链接

LFW 5k+人脸,超过10K张 标准的人脸识别数据集 链接

MultiPIE 337个人的不同姿态、表情、光照的人脸图像,共750k+人脸图像 限制场景人脸识别 链接 需购买

MegaFace 690k不同的人的1000k人脸图像 新的人脸识别评测集合 链接

IJB-A 人脸识别,人脸检测 链接

CAS-PEAL 1040个人的30k+张人脸图像,主要包含姿态、表情、光照变化 限制场景下人脸识别 链接

Pubfig 200个人的58k+人脸图像 非限制场景下的人脸识别 链接

人脸检测

数据库

描述

用途

获取方法

FDDB 2845张中的5171张脸 标准人脸检测评测集 链接

IJB-A 人脸识别,人脸检测 链接

Caltech10k Web Faces 10k+人脸,提供双眼和嘴巴的坐标位置 人脸点检测 链接

人脸表情

数据库

描述

用途

获取方法

CK+ 137个人的不同人脸表情视频帧 正面人脸表情识别 链接

人脸年龄

数据库

描述

用途

获取方法

IMDB-WIKI 包含:IMDb中20k+个名人的460k+张 和维基百科62k+张, 总共: 523k+张 名人年龄、性别 链接

Adience 包含2k+个人的26k+张人脸图像 人脸性别,人脸年龄段(8组) 链接

CACD2000 2k名人160k张人脸 人脸年龄 链接

人脸性别

数据库

描述

用途

获取方法

IMDB-WIKI 包含:IMDb中20k+个名人的460k+张 和维基百科62k+张, 总共: 523k+张 名人年龄、性别 链接

Adience 包含2k+个人的26k+张人脸图像 人脸性别,人脸年龄段(8组) 链接

人脸关键点检测

数据库

描述

用途

获取方法

数据库 描述 用途 获取方法

人脸其它

数据库

描述

用途

获取方法

CeleBrayA 200k张人脸图像40多种人脸属性 人脸属性识别 获取方法

GitHub:DeepFace

1、文献党下载器一款资源集成的文献下载平台,几乎整合了所有中外文献数据库资源,覆盖全科以及各种文献类型。整合资源包括知网、万方、维普、SpringerLink、Elsevier(sciencedirect)、Wiley 、Web of Science、PubMed 、EI、ProQuest(国外学位论文)等数据库资源,还有大量的世界知名期刊,如:nature《自然》、science《科学》、CELL《细胞》、PNAS《美国科学院院报》等等。只要有互联网有电脑,在哪里都可以查找下载文献。

2、知网:全球最大的中文数据库。提供中国学术文献、外文文献、学位论文、报纸、会议、年鉴、工具书等各类资源,并提供在线阅读和下载服务。涵盖领域包括:基础科学、文史哲、工程科技、社会科学、农业、经济与管理科学、医药卫生、信息科技等。

3、万方数据库:是由万方数据公司开发的,涵盖期刊、会议纪要、论文、学术成果、学术会议论文的大型网络数据库;也是和中国知网齐名的中国专业的学术数据库。

学科分类:综合,机械,电子电气,计算机/信息科学,能源/动力工程,建筑/土木工程,艺术,社会科学,语言/文学,教育,哲学,政治,生物,材料科学,环境科学,化学/化工,物理,数学。

4、Web of Science是获取全球学术信息的重要数据库。其中以SCIE、SSCI、A&HCI等引文索引数据库,JCR期刊引证报告和ESI基本科学指标享誉全球科技和教育界。Web of Science收录了论文中所引用的参考文献,通过独特的引文索引,用户可以用一篇文章、一个专利号、一篇会议文献、一本期刊或者一本书作为检索词,检索它们的被引用情况,轻松回溯某一研究文献的起源与历史,或者追踪其最新进展;可以越查越广、越查越新、越查越深。

5、Wiley 作为全球最大、最全面的经同行评审的科学、技术、医学和学术研究的在线多学科资源平台之一,Wiley及旗下的子品牌出版了超过500位诺贝尔奖得主的作品。“Wiley Online Library”覆盖了生命科学、健康科学、自然科学、社会与人文科学等全面的学科领域。Wiley Online Library上有1600多种经同行评审的学术期刊,20000本电子图书,170多种在线参考工具书,580多种在线参考书,19种生物学、生命科学和生物医学的实验室指南(Current Protocols),17种化学、光谱和循证医学数据库(Cochrane Library)。

6、Elsevier(sciencedirect)是荷兰一家全球著名的学术期刊出版商,每年出版大量的学术图书和期刊,大部分期刊被SCI、SSCI、EI收录,是世界上公认的高品位学术期刊。scienceDirect是爱思唯尔公司的全文数据库平台,是全球最大的科学、技术与医学全文电子资源数据库,提供2500余种学术期刊以及37000余种图书的全文内容。包括全球影响力极高的CELL《细胞杂志》、THE LANCET《柳叶刀杂志》等。

7、SpringerLink是全球最大的在线科学、技术和医学(STM)领域学术资源平台。Springer 的电子图书数据库包括各种的Springer图书产品,如专著、教科书、手册、地图集、参考工具书、丛书等。具体学科涉及:数学、物理与天文学、化学、生命科学、医学、工程学、计算机科学、环境科学、地球科学、经济学、法律。

8、PubMed 是一个免费的搜寻引擎,提供生物医学方面的论文搜寻以及摘要的数据库。它的数据库来源为MEDLINE。其核心主题为医学,但亦包括其他与医学相关的领域,像是护理学或者其他健康学科。PubMed 的资讯并不包括期刊论文的全文,但可提供指向全文提供者(付费或免费)的链接。

以上就是关于NCBI转录组数据能否直接下载FASTA格式序列,windows 32 *** 作系统无法将下载的SRA文件转换成FASTQ文件。全部的内容,包括:NCBI转录组数据能否直接下载FASTA格式序列,windows 32 *** 作系统无法将下载的SRA文件转换成FASTQ文件。、谁知道怎样在NCBI中找数据库、在哪里能找到供学生练习用的数据库等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/9810771.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-02
下一篇 2023-05-02

发表评论

登录后才能评论

评论列表(0条)

保存