华大测序仪没有生成fq文件

华大测序仪没有生成fq文件,第1张

格式的文件

中华大测序仪由于采用无模式测序技术,不会生成FQ格式的文件,而是生成了csfasta和qual文件。csfasta文件包含测序的序列信息,而qual文件则是用来记录每个碱基的质量值的。

Q20值是指的测序过程碱基识别(Base Calling)过程中,对所识别的碱基给出的错误概率。

如果质量值是Q20,则错误识别的概率是1%,即错误率1%,或者正确率是99%;

如果质量值是Q30,则错误识别的概率是0.1%,即错误率0.1%,或者正确率是99.9%;

如果质量值是Q40,则错误识别的概率是0.01%,即错误率0.01%,或者正确率是99.99%;

你发现规律没有,Q“N”0的质量值,就是正确率有N个9的百分比,这样就非常容易记忆了。

二代测序数据下机后一般为rawdata,这时候含有一些低质量测序数据和街头污染数据,我们要将低质量数据过滤掉获得cleandata用于后续分析;

Fastqc(用于测序数据质控),

MultiQC(用于质控结果整合和解读)

Trimmomatic(用于测序数据修剪和过滤)

fastqc运行结果图:

运行结束后,每个fq.gz文件会产生两个文件,一个是zip压缩文件,一个是html文件,将所有样品的文件转移到新的文件夹中。

如,可以将所有的zip文件和html文件转移到名字为fastqc的文件夹中。

根据multiqc整合结果分析测序数据质量

从上图可以看出,前15个碱基含量分布异常,

因此我们要将前15个碱基修剪掉,同时过滤掉低质量数据()


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/tougao/11808853.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-18
下一篇 2023-05-18

发表评论

登录后才能评论

评论列表(0条)

保存