genbank文件转换成NCBI提交数据时的.tbl文件（genbank convert to tbl）_教程

ftp://ftp.ncbi.nlm.nih.gov//toolbox/ncbi_tools/converters/scripts/gbf2tbl.pl

网址https://chlorobox.mpimp-golm.mpg.de/GenBank2Sequin.html

这个学期一直在看和叶绿体基因组相关的文章，目前学习到向NCBI提交完整的叶绿体基因组序列，需要准备的文件包括叶绿体基因组fasta文件和注释文件，注释文件要求的格式为.tbl，按照常理应该会有已经造好的轮子来利用常规的注释文件（比如genbank格式，或者gff3格式）来生成.tbl文件，可是自己找了将近两天的时间竟然没有找到（找到了一些python脚本或者小软件，但是都没有运行成功；同时也找到了NCBI提供的小软件table2asn_GFF3，目测功能是利用gff3格式的注释文件生成.tbl文件，试运行了一下，可是参数太多，暂时还没有搞明白该怎么使用），自己也尝试着写了一些脚本，奈何能力有限没烂档有能够解决，前前后后大约折腾了4天左右的时间，之后因为忙一些其他事情中断了一个星期左右，今天再次尝试的时候发现原来叶绿体基因组注释在线工具GeSeqhttps://chlorobox.mpimp-golm.mpg.de/geseq.html 中包括了格式转换的工具GB2sequin,然后找到了这篇文献来看又发现了卖困格式转换用到的perl脚本，暂时解决了提交序列的问题！

面对解决不了的问题不要着急，只需要停下来让脑子休息下然后在重新出发！

推荐一篇论文

接下来是为genbank文件添加product字段

理解了SeqIO解析genbank格式文件的数据存储后，自己应该也可以写一个简单的脚本将genbank格式的文件转化成.tbl文件，好好想一想该如何实现；SeqIO模块的源码自己抽时间要多看几遍！

自己的叶绿体基因组数据注释是使用在线程序GeSeq做的，输出结果genBank文件中包括intron和exon的信息，不想要这部分信息，想写个脚本删掉

一直遇到报错 IndexError: pop index out of range

想了好长时间才想明白： rec 里面存储的内容删除一项后，对应的后面的内容的index会相应迁移，比如有1，5，7，9，12五个数字，对应的位置分别是1，2，3，4，5；如果删除前两个中历念，12对应的位置就有原来的5 改为了3

是数据库的 table 文件，属性数据表结构文逗者梁件定义了地图属性数据的表结构，包括字段数、字段名山运称、字段类型和字段宽度、索引字段及相嫌陆应图层的一些关键空间信息描述。用相应的数据库软件应该可以打开。可以把txt的文件转换成tbl的。

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/tougao/8186615.html

genbank文件转换成NCBI提交数据时的.tbl文件（genbank convert to tbl）

发表评论

评论列表（0条）