sisichen �
关注
国家基因组科学数据中心(NGDC)---组学原始数据如何上传GSA 原创
2022-04-25 14:44:31
sisichen �
码龄4年
关注
文章目录
前言
一、什么是NGDC?
二、NGDC的发展历程
三、什么是GSA?
四、为什么选择上传数据到GSA?
五、如何上传测序原始数据至GSA?(重点!!附详细步骤!!)
1 准备要上传的数据
2 计算MD5码
3进入NGDC主页,登入账户
4 填写数据信息
第一步:建立Bioproject。
第二步:建立BioSample。
第三步:创建GSA。
进入GSA数据库
新建GSA
填写信息
下载表格文件
5 数据上传:
(1) 通过FTP软件 上传(上传需要流量!!如果小数据可以用)
(2) 通过服务器上传(推荐!!):如果实验室有服务器的话,推荐服务器上传,步骤如下:(服务器上要先安装ftp )
(3)邮寄硬盘
6等待审核
总结
前言
在发表文章之前我们需要将测序的原始数据上传到一个公共库,并在文中提供accession number,实现数据的公开共享,这是国际惯例。以前我们上传数据时只能上传到美国国立生物技术信息中心(NCBI)、欧洲生物信息学研究所(EBI)、日本核酸数据库(DDBJ),现在中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心 (CNCB-NGDC)—中国的 “NCBI” 已经建立并日渐完善。组学原始数据归档库(GSA)是组学原始数据汇交、存储、管理与共享系统,是国内首个被国际期刊认可的组学数据发布平台。GSA已获得多个国际期刊认可,并已被国际著名出版商Elsevier收录为指定的基因数据归档库,其权威性得到国内外100余家学术杂志的认可。GSA已通过FAIRsharing认证,获得Wiley出版集团认可,因此我们不用担心上传数据到GSA不被期刊认可,也不用再舍近求远上传数据到NCBI,作为中国人,我们一定要支持我们NGDC中的数据库。本文介绍了如何上传测序原始数据到GSA,附详细 *** 作步骤。
一、什么是NGDC?
国家基因组科学数据中心(>
gisaid是流感数据库,你先得有一个账号才能下载。
注册账号需要填写相关的东西,完了过一段时间会给你注册的邮箱发邮件的,不一定能申请成功。原因我不说。
注册成功后登陆,进入一个这个界面。
点击选择病毒亚型之类的信息,输入关键词,点击右下角的search,之后勾选,下载就可以了。
NCBI NCBI下有很多数据库,以下是蛋白质序列
PopSet包含研究一个人群、一个种系发生或描述人群变化的一组组联合序列。PopSet既包含核酸序列数据又包含蛋白质序列数据。
Entrez 功能强大,在于它的大多数记录可相互链接,既可在同一数据库内链接,也可在数据库之间进行链接。当运用BLAST软件比较某氨基酸或DNA序列与库中其他氨基酸或DNA序列差异即进行相似性检索时,则会涉及到蛋白质库或核苷酸库的库内链接。库间链接发生在核苷酸数据库内的记录与PubMed库中已发表序列的引文间的链接,或蛋白质序列记录与核苷酸序列库中编码它的核苷酸序列间的链接。
BLAST(Basic Local Alignment Search Tool)是用于序列相似性检索的一个重要数据库,是区分基因和基因特征的工具。该软件能在15秒内完成整个DNA数据库的序列检索。BLAST记录的相关度有明确的统计学解释,以便更容易地将相关记录与随机的数据库记录相区分。在NCBI主页的左工具条中,点击BLAST图标,即进入BLAST主页。
BLAST 主页提供了几种BLAST检索软件。其中BLAST20是一种新的BLAST检索工具,它在原有基础上作了改进,运行速度更快,灵敏度更高,同时具有Gapped BLAST 和PSI-BLAST两种软件的新功能。Gapped BLAST 允许在对准的序列中引入空位(碱基缺失或插入),引入空位(Gaps)意味着在比较两个相关序列时不会出现中断(Break)现象。这些空位对准的记分系统更能反映相关序列的类似程度。PSI-BLAST的全称是Position-Specific Iterated BALST,即特殊位置重复BLAST,它提供了自动、易用的概貌(Profile)检索,是查找序列同源的有效工具。
Dnastar 可以用于解决你踢完的后半个问题
以上就是关于国家基因组科学数据中心怎么用全部的内容,包括:国家基因组科学数据中心怎么用、目前知名的序列数据库有哪些如何从数据库中获取一个已知基因的序列(分子生物学简答题)、怎么从gisaid数据库下基因等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)