UniProtKB/TrEMBL收录的则是高质量的经计算机分析后进行自动注释和分类的序列。计算机辅助注释使用的是Spearmint规则,而人工注释依据的则是蛋白质家族规则,包括HAMAP家族规则(HAMAP family rules)、RuleBase规则、PIRSF分类命名规则以及位点规则。
UniProtKB/TrEMBL还收录了所有EMBL-Bank/ GenBank/DDBJ核酸序列数据库中的编码序列的翻译后蛋白质序列和来自拟南芥信息资源库(TAIR)、SGD和人类Ensembl数据库中序列的翻译后蛋白质序列。
UniProtKB/TrEMBL收录的则是高质量的经计算机分析后进行自动注释和分类的序列。计算机辅助注释使用的是Spearmint规则,而人工注释依据的则是蛋白质家族规则,包括HAMAP家族规则(HAMAP family rules)、RuleBase规则、PIRSF分类命名规则以及位点规则。
UniProtKB/TrEMBL还收录了所有EMBL-Bank/ GenBank/DDBJ核酸序列数据库中的编码序列的翻译后蛋白质序列和来自拟南芥信息资源库(TAIR)、SGD和人类Ensembl数据库中序列的翻译后蛋白质序列。
回答不容易,希望能帮到您,满意请帮忙采纳一下,谢谢 !
首先拿到转录因子的基因ID,你既然说是29个我想你已经拿到这29个SBP基因的名字了吧。
然后上 msu的Rice网站 以及 拟南芥的TAIR网站 的ftp下载全体蛋白的序列。
具体:
ftp://ftpplantbiologymsuedu/pub/data/Eukaryotic_Projects/o_sativa/annotation_dbs/pseudomolecules/version_70/alldir/allpep
和
ftp://ftpplantbiologymsuedu/pub/data/Eukaryotic_Projects/o_sativa/annotation_dbs/pseudomolecules/version_70/alldir/allpep
然后根据名字自己提取,这个随便什么编程语言都可以做的。
以上就是关于如何在uniprot中找到蛋白质数据量最多的十个物种全部的内容,包括:如何在uniprot中找到蛋白质数据量最多的十个物种、UniProt怎么检索二硫键、求教perl大神,如何编写程序把拟南芥数据库中水稻基因组中29个SBP转录因子基因的序列下载下来,谢谢啊等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)