BAM文件转换成fastq

BAM文件转换成fastq,第1张

此肆灶外,也可以用samtools里面的bam2fq命令信雹吵

Converting BAM to fastq

bam文件转为滑侍fastq - 生物信息文件夹

在一年前,我写过一篇文章,叫做 如何从BAM文件中提取fastq ,之前也发现了从BAM里面提取Fastq是有些麻烦,只不过最后通过 samtools 的子命令实现了数据提取,实现功能之后也没有再去思考如何提高效率。

最近读到 每周文献-190419-植物单细胞BAM重比对以及假基因研究 时,发现陆歼此里面提到了一个工具叫做 bazam , 功能就是提取Fastq文件,文章发表在 Genome Biology 上。

软件地址为 https://github.com/ssadedin/bazam ,因为他是个Groovy工具(据说Groovy比Java好写)所以安装很方便,

可以通过如下命令检查是否安装成功

假如你原来的BAM文件是双端测序,想提取成两个文件,那么可以用如下命令。 :这里的your.bam 指的是你实际BAM文件

此外,bazam还支持使用 -L 指定区间来提取某个区间的数据。

这里补充下为啥从BAM文件中提取双端序列那么麻烦,这是因为改庆一般而言BAM文件都是按照位置信息排序,想要找到配对的reads,要么是根据read的编号进行排序(这个方法要求额外的内存和存储空间),或者就是在早迅提取的时候记录当前的read的ID,再找到另一端ID后释放内存空间。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/8151088.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-13
下一篇 2023-04-13

发表评论

登录后才能评论

评论列表(0条)

保存