FLAG文件主要归类为GraphicFiles,Windows *** 作系统可用于查看FLAG文件,这些程序通常可以在台式计算机(以及一些移动设备)上找到,使您能够迹仔查看并有时编辑上述格式文件,FLAG文件的普及性为“低”,这姿尺汪意味着这些文件不是很普及。
文件扩展名FLAG是有一种文件类型,并且与一种不同的软件程序相关联,但主要相关联软件程序是由Interscape开发的FlagMaker。通常这些被格式化为FlagMakerDocument。FLAG文件主要归类为GraphicFiles。
每次遇到BAM文件flag值都有一些困惑,时间越或运久越迷惑。
在此,针对BAM文件中的flag信息进行梳理和解释:
记录于BAM文件的第2列,以巧芦 bwa 软件比对结果为例
可以使用samtools查询:
samtools view test.bam | cut -f2 | uniq
问题来了,这些数字的意义是什么呢?
首先可以参考SAM/BAM文件的解释文档:
http://samtools.sourceforge.net/SAMv1.pdf
其中,对于FLAG有如下说明:
FLAG: bitwise FLAG. Each bit is explained in the following table:
| Bit | Description |
| 0x1 | template having multiple segments in sequencing |
| 0x2 | each segment properly aligned according to the aligner |
| 0x4 | segment unmapped |
| 0x8 | next segment in the template unmapped |
| 0x10 | SEQ being reverse complemented |
| 0x20 | SEQ of the next segment in the template being reversed |
| 0x40 | the first segment in the template |
| 0x80 | the last segment in the template |
| 0x100 | secondary alignment |
| 0x200 | not passing quality controls |
| 0x400 | PCR or optical duplicate |
| 0x800 | supplementary alignment |
上述0x1, 0x2, …是 十六进制 的数值与十进制的数字截然不同。
对应的十进制数值描述如下:
| 十进制 | 描述 |
| 1 | template having multiple segments in sequencing |
| 2 | each segment properly aligned according to the aligner |
| 4 | segment unmapped |
| 8 | next segment in the template unmapped |
| 16 | SEQ being reverse complemented |
| 32 | SEQ of the next segment in the template being reversed |
| 64 | the first segment in the template |
| 128 | the last segment in the template |
| 256 | secondary alignment |
| 512 | not passing quality controls |
| 1024 | PCR or optical duplicate |
| 2048 | supplementary alignment |
回过头来看,比如16和1024分别是比对到互孝团带补链的片段,对于1024指的是PCR重复片段。
那其他数字的含义呢,他们只是简单数字组合而已,例如:1040是1024 + 16,Read比对到反义链且是一个PCR重复,简单的数字相加而已。
也可以借助 flag解释链接 来解析上述数字的含义,如把1040输入到该网站会返回:
“read reverse strand”和“read is PCR or optical duplicate”。
不过,SAM说明文档中FLAG的代号均使用按位符号显示。bit是信息的基本单元且只有2个数值,1和0。
这谁能搞的懂啊?!
直接用linux bc转换吧:
按下表对10000010000从右到左依次读取:
故BAM flag转换为元字符,轻松获取各种类型BAM flag值背后的信息。
参考资料
https://davetang.org/muse/2014/03/06/understanding-bam-flags/
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)