输入文件有:物种基因组序列文件、物种基因组注释文件、转录本比对后的BAM文件;
以斑胸草雀为例:
-基因组注释文件: GCF_003957565.2_bTaeGut1.4.pri_genomic.gtf
-基因组序列文件: GCF_003957565.2_bTaeGut1.4.pri_genomic.fna
-转录本比对文件: myBAMfile.bam
文件内容一览:
samtools view myBAMfile.bam | less -S 查看BAM文件内容
如果要查看所有转录本的比对情况基本是不现实的(一般上百G),受限于电脑性能无法加载这么大的bam文件,所以查看reads的比对情况一般通过提取出map到基因组的其中一个Scaffold的所有reads的bam文件。
示例从BAM文件提取斑胸草雀转录本比对到Scaffold NC_007897.1 的所有reads
打开IGV浏览器,首先载入基因组文件,点击Genomes选择加载本地基因组,导入GCF_003957565.2_bTaeGut1.4.pri_genomic.fna文件
然后选择File点击Load from file选择加载本地gtf文件,导入GCF_003957565.2_bTaeGut1.4.pri_genomic.gtf
加载BAM文件
samtools view [‐bhuHS] [‐t in.refList] [‐o output] [‐f reqFlag] [‐F skipFlag] [‐q minMapQ] [‐l library] [‐r read‐Group] <in.bam>|<in.sam>
-b 以BAM格式输出,可以用于samtools的后续分析
-u 以未压缩的BAM格式输出,可以节约时间,一般在管道执行时使用
-h 在结果中包含头header
-H 只输出开头
samtools view -h 文件名 | less -S
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)