中华大测序仪由于采用无模式测序技术,不会生成FQ格式的文件,而是生成了csfasta和qual文件。csfasta文件包含测序的序列信息,而qual文件则是用来记录每个碱基的质量值的。
二代测序数据下机后一般为rawdata,这时候含有一些低质量测序数据和街头污染数据,我们要将低质量数据过滤掉获得cleandata用于后续分析;
Fastqc(用于测序数据质控),
MultiQC(用于质控结果整合和解读)
Trimmomatic(用于测序数据修剪和过滤)
fastqc运行结果图:
运行结束后,每个fq.gz文件会产生两个文件,一个是zip压缩文件,一个是html文件,将所有样品的文件转移到新的文件夹中。
如,可以将所有的zip文件和html文件转移到名字为fastqc的文件夹中。
根据multiqc整合结果分析测序数据质量
从上图可以看出,前15个碱基含量分布异常,
因此我们要将前15个碱基修剪掉,同时过滤掉低质量数据()
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)