PDB、NDB数据库,tRNA数据库,以及你想要的其他种类的RNA数据库。
其中PDB、NDB数据库比较权威,可靠性较高,也比较全面
根据需要从一级数据库中搜集对象的相关数据集合而成的就是二级数据库。像genebank,EMBL这种都是不加选择的一级数据库,只要是实验获得的,不管什么东西的序列,哪怕是不完整的序列都能上传,而且它们的数据也有可能有重复。如果有某个人专门研究细菌的鉴定,需要用到正式被认可的16srDNA序列,为了研究方便,把这些一级数据库的各个种类细菌的公认标准16srDNA序列的数据进行整理,重新构建了一个数据库,这就是所谓的二级数据库。如果不构建,直接用一级数据库做blast,就会得出很多未被承认甚至不完整的序列,还要人工一个个看过去,找出公认的标准序列,这样就很麻烦。我举得例子在现实中就是韩国的EzTaxon。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)