U盘上FLAG文件是什么意思

U盘上FLAG文件是什么意思,第1张

系统文困磨件。

FLAG文件主要归类为GraphicFiles,Windows *** 作系统可用于查看FLAG文件,这些程序通常可以在台式计算机(以及一些移动设备)上找到,使您能够迹仔查看并有时编辑上述格式文件,FLAG文件的普及性为“低”,这姿尺汪意味着这些文件不是很普及。

文件扩展名FLAG是有一种文件类型,并且与一种不同的软件程序相关联,但主要相关联软件程序是由Interscape开发的FlagMaker。通常这些被格式化为FlagMakerDocument。FLAG文件主要归类为GraphicFiles。

每次遇到BAM文件flag值都有一些困惑,时间越或运久越迷惑。

在此,针对BAM文件中的flag信息进行梳理和解释:

记录于BAM文件的第2列,以巧芦 bwa 软件比对结果为例

可以使用samtools查询:

samtools view test.bam | cut -f2 | uniq

问题来了,这些数字的意义是什么呢?

首先可以参考SAM/BAM文件的解释文档:

http://samtools.sourceforge.net/SAMv1.pdf

其中,对于FLAG有如下说明:

FLAG: bitwise FLAG. Each bit is explained in the following table:

| Bit | Description |

| 0x1 | template having multiple segments in sequencing |

| 0x2 | each segment properly aligned according to the aligner |

| 0x4 | segment unmapped |

| 0x8 | next segment in the template unmapped |

| 0x10 | SEQ being reverse complemented |

| 0x20 | SEQ of the next segment in the template being reversed |

| 0x40 | the first segment in the template |

| 0x80 | the last segment in the template |

| 0x100 | secondary alignment |

| 0x200 | not passing quality controls |

| 0x400 | PCR or optical duplicate |

| 0x800 | supplementary alignment |

上述0x1, 0x2, …是 十六进制 的数值与十进制的数字截然不同。

对应的十进制数值描述如下:

| 十进制 | 描述 |

| 1 | template having multiple segments in sequencing |

| 2 | each segment properly aligned according to the aligner |

| 4 | segment unmapped |

| 8 | next segment in the template unmapped |

| 16 | SEQ being reverse complemented |

| 32 | SEQ of the next segment in the template being reversed |

| 64 | the first segment in the template |

| 128 | the last segment in the template |

| 256 | secondary alignment |

| 512 | not passing quality controls |

| 1024 | PCR or optical duplicate |

| 2048 | supplementary alignment |

回过头来看,比如16和1024分别是比对到互孝团带补链的片段,对于1024指的是PCR重复片段。

那其他数字的含义呢,他们只是简单数字组合而已,例如:1040是1024 + 16,Read比对到反义链且是一个PCR重复,简单的数字相加而已。

也可以借助 flag解释链接 来解析上述数字的含义,如把1040输入到该网站会返回:

“read reverse strand”和“read is PCR or optical duplicate”。

不过,SAM说明文档中FLAG的代号均使用按位符号显示。bit是信息的基本单元且只有2个数值,1和0。

这谁能搞的懂啊?!

直接用linux bc转换吧:

按下表对10000010000从右到左依次读取:

故BAM flag转换为元字符,轻松获取各种类型BAM flag值背后的信息。

参考资料

https://davetang.org/muse/2014/03/06/understanding-bam-flags/


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12138631.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存