xshell连接NCBI服务器 输入命令 ftp
连接成功后输入账号 密码
mkdir命令创建一个文件夹,以你的BioProject accession命名
FTP 连接成功后连接成功后
进入刚才建立的BioProject文件夹
把原始数据拖进去即可
传输过程中,如果一定时间(五分钟?)没有激活传输界面,可能会导致连接断开
进度可能会一直停在99%,重新连接成功后,也一直卡在99%,不过似乎数据还是上传成功了的
传输成功的会显示linked,同时FTP里对应的文件会消失 传输成功的会显示linked,同时FTP里对应的文件会消失
全部文件夹都传输成功了会变成queued
然后就等NCBI处理了
不管你用什么东东,你下文件总得给出文件地址或者文件参数再下载,所以本质上没太多区别。
你的逻辑是从数据库拿数据然后生成文件,然后再下载;
首先你得把数据拿出来,然后用io类生成临时文件,如果为了偷懒,想直接给个url就完了,那就把文件生在工程根目录下比如:proname/downtemp/1234doc
然后把绝对路径给出,就可以下载了 ,这中间可能要跳转一下,因为你是临时产生,不是直接下载。
我觉得你要实现的这个可能跟SpringMvc的关系不是很大。你要达到的目的其实就是在jvm启动的时候把数据库数据加载一份到内存,一个静态变量和一个静态初始化块就可以搞定你的问题,这两者都是在类加载的时候初始化一次,像前面回答的一样,你可以用一个HashMap搞定。稍微具体来说,一个静态变量public static final Map<key,value> cache=new HashMap<key,value>()static { cache=请求数据库 *** 作}key你自己加,String还是int都行,value是你数据库的结构,可以写个实体。获取的时候直接cacheget(key)就可以了。
亲!!我想问问你怎么下载NCBI上的数据库的,有的好大啊!我现在需要microbe的序列,但是那个好像10G,下 了一半又得从头开始下,无语了。能教我一下吗?
另外,您是在国内还是国外内?是研究生还是本科生还是工作人员呢?以前发过论文嘛?
如果您的发现确实是新的,确实有突破(有可能别人已经发过相似的论文,只不过您不知道而已),是可以发的。
方法/步骤
进入NCBI主页,选择Nucleotide数据库
在Nucleotide数据库的检索框中输入甘油醛-3-磷酸脱氢酶基因的基因名(GAPDH)或者基因的GenBank号:X026621。点击搜索。在右边Top Organisms中选择物种来源,点More可以显示更多隐藏选项
选择所需要的物种信息
GenBank会根据设定的检索条件得出相应结果,选择所需要的序列
点击相应序列打开详序列的细信息,默认为GBFF(GenBank Flat File)格式文件。主要包括以下三部分组成:第一部分:描述符,其中包含了关于整个记录的信息;第二部分:特征表,包含了注释这一记录的特性;第三部分:核酸序列本身;在最后一行以“// ”结尾
在这里也可以选择FASTA格式。
FASTA格式又称Pearson 格式
特点:最常用、最简单的序列注释格式
命名规则:
1、以大于号“>"起始
2、 标题行(a single-line description) 位于文件的第一行
3、 序列行随后,序列行中不允许有空间,每行文字不超 过80个字符
4、组成序列信息字符串的符号应为IUB/IUPAC(International Union Of Pure And Applied Chemistry)核苷酸或氨基酸的符号
5、核苷酸字符大小写均可,氨基酸字符应大写
6、"-"单个连字符表示一个空位 “gap”
7、序列中不允许有数字、不明确的核苷酸用N表示,氨基酸用X表示
8、 氨基酸序列中“”表示终止
导出序列时点击Send to
在d出的窗口选择文件单选按钮
在下拉框中选择你需要的文件格式
点击创建文件即可开始下载,下载后的文件可以通过任意文本编辑软件打开。由于NCBI上的文件采用的是Unix/Linux文本格式,而Unix系统里,每行结尾只有“<换行>”,即“\n”;但Windows系统里面,每行结尾是“<换行><回车>”,即“\n\r”,在用记事本等软件打开时每行结尾有一个黑方框,这里只需用兼容Unix/Linux文本格式的编辑器打开即可
以上就是关于转录组测序所得的数据,怎样传到NCBI的SRA数据库全部的内容,包括:转录组测序所得的数据,怎样传到NCBI的SRA数据库、怎样从数据库输出数据到文件中,再对该文件进行下载 java、系统怎么从数据库中取出数据等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)