命令行也借鉴一下(小小的改动),对很多参数不是很懂。
/SSD750/PB1/soft1/trim_galore_v0.4.2/trim_galore -q 30 --phred33 --stringency 3 --path_to_cutadapt /opt/anaconda2/bin/cutadapt --fastqc -e 0.1 --length 35 --three_prime_clip_R1 1 --three_prime_clip_R2 1 -o /home/test04/lyr/WGR/ /home/test04/lyr/WGR/xinjiangshida/170926001WL_S1_L001_R1_001.fastq /home/test04/lyr/WGR/xinjiangshida/170926001WL_S1_L001_R2_001.fastq
结果,过程参考博文
https://blog.csdn.net/lixiangyong123/article/details/52062323
1,拿到原始数据后,首先用软件 FastQC 看一下数据质量
得到html文件,打开后如图
我们比较关心的数据信息
使用安装好的trim_galore去除质量的reads。该软件需要调用FastQC和cutadapt ,需要提前装好
2,这两步处理完后可以再次用FastQC看一下质量,没啥问题就继续往下做
基本上数据的质量还是不错的,可以进行后续的拼接和组装。
参考博文
http://blog.sciencenet.cn/home.php?mod=space&uid=635619&do=blog&id=884213
写在前面参考1
参考2
1 Trim Galore 是对 FastQC 和 Cutadapt 的包装。
2 trim_galore适用于所有高通量测序,包括RRBS(Reduced Representation Bisulfite-Seq ), Illumina、Nextera和smallRNA测序平台的双端和单端数据。
3 主要功能包括两步:
第一步 首先去除低质量碱基,然后去除3' 末端的adapter(如果没有指定具体的adapter,程序会自动检测前1million的序列)
第二步 对比前12-13bp的序列是否符合以下类型的adapter :
https://www.cnblogs.com/weipeng-loaded/p/10601285.html
FastQC (测序质量分析)
先看利用fastqc检测原始序列的质量:
当任一位置的A/T比例与G/C比例相差超过10%,报'WARN';当任一位置的A/T比例与G/C比例相差超过20%,报'FAIL'
重新用fastqc检测进行过滤后的reads质量
附注,处理信息
出现了一个报错
与python有关;解决方案
https://www.cnblogs.com/lovebing/p/13048948.html
https://blog.csdn.net/qq_41185868/article/details/82079079
########暂时没有解决!
其他软件:
数据过滤之 Trimmomatic 详细说明
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)