Trim_galore使用（2018-05-25）_软件运维

安装了半天没安上，用了公司服务器已经安装的trim_galore。

命令行也借鉴一下（小小的改动），对很多参数不是很懂。

/SSD750/PB1/soft1/trim_galore_v0.4.2/trim_galore -q 30 --phred33 --stringency 3 --path_to_cutadapt /opt/anaconda2/bin/cutadapt --fastqc -e 0.1 --length 35 --three_prime_clip_R1 1 --three_prime_clip_R2 1 -o /home/test04/lyr/WGR/ /home/test04/lyr/WGR/xinjiangshida/170926001WL_S1_L001_R1_001.fastq /home/test04/lyr/WGR/xinjiangshida/170926001WL_S1_L001_R2_001.fastq

结果，过程参考博文

https://blog.csdn.net/lixiangyong123/article/details/52062323

1，拿到原始数据后，首先用软件 FastQC 看一下数据质量

得到html文件，打开后如图

我们比较关心的数据信息

使用安装好的trim_galore去除质量的reads。该软件需要调用FastQC和cutadapt ，需要提前装好

2，这两步处理完后可以再次用FastQC看一下质量，没啥问题就继续往下做

基本上数据的质量还是不错的，可以进行后续的拼接和组装。

参考博文

http://blog.sciencenet.cn/home.php?mod=space&uid=635619&do=blog&id=884213

写在前面

参考1

参考2

1 Trim Galore 是对 FastQC 和 Cutadapt 的包装。

2 trim_galore适用于所有高通量测序，包括RRBS(Reduced Representation Bisulfite-Seq ), Illumina、Nextera和smallRNA测序平台的双端和单端数据。

3 主要功能包括两步：

第一步首先去除低质量碱基，然后去除3' 末端的adapter(如果没有指定具体的adapter，程序会自动检测前1million的序列）

第二步对比前12-13bp的序列是否符合以下类型的adapter :

https://www.cnblogs.com/weipeng-loaded/p/10601285.html

FastQC （测序质量分析）

先看利用fastqc检测原始序列的质量：

当任一位置的A/T比例与G/C比例相差超过10%，报'WARN'；当任一位置的A/T比例与G/C比例相差超过20%，报'FAIL'

重新用fastqc检测进行过滤后的reads质量

附注，处理信息

出现了一个报错

与python有关；解决方案

https://www.cnblogs.com/lovebing/p/13048948.html

https://blog.csdn.net/qq_41185868/article/details/82079079

########暂时没有解决!

其他软件：

数据过滤之 Trimmomatic 详细说明

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/yw/8166955.html

Trim_galore使用（2018-05-25）

发表评论

评论列表（0条）