Trim_galore使用(2018-05-25)

Trim_galore使用(2018-05-25),第1张

安装了半天没安上,用了公司服务器已经安装的trim_galore。

命令行也借鉴一下(小小的改动),对很多参数不是很懂。

/SSD750/PB1/soft1/trim_galore_v0.4.2/trim_galore -q 30 --phred33 --stringency 3 --path_to_cutadapt /opt/anaconda2/bin/cutadapt --fastqc -e 0.1 --length 35 --three_prime_clip_R1 1 --three_prime_clip_R2 1 -o /home/test04/lyr/WGR/ /home/test04/lyr/WGR/xinjiangshida/170926001WL_S1_L001_R1_001.fastq /home/test04/lyr/WGR/xinjiangshida/170926001WL_S1_L001_R2_001.fastq

结果,过程参考博文

https://blog.csdn.net/lixiangyong123/article/details/52062323

1,拿到原始数据后,首先用软件 FastQC 看一下数据质量

得到html文件,打开后如图

我们比较关心的数据信息

使用安装好的trim_galore去除质量的reads。该软件需要调用FastQC和cutadapt ,需要提前装好

2,这两步处理完后可以再次用FastQC看一下质量,没啥问题就继续往下做

基本上数据的质量还是不错的,可以进行后续的拼接和组装。

参考博文

http://blog.sciencenet.cn/home.php?mod=space&uid=635619&do=blog&id=884213

写在前面

参考1

参考2

1 Trim Galore 是对 FastQC 和 Cutadapt 的包装。

2 trim_galore适用于所有高通量测序,包括RRBS(Reduced Representation Bisulfite-Seq ), Illumina、Nextera和smallRNA测序平台的双端和单端数据。

3 主要功能包括两步:

第一步 首先去除低质量碱基,然后去除3' 末端的adapter(如果没有指定具体的adapter,程序会自动检测前1million的序列)

第二步 对比前12-13bp的序列是否符合以下类型的adapter :

https://www.cnblogs.com/weipeng-loaded/p/10601285.html

FastQC (测序质量分析)

先看利用fastqc检测原始序列的质量:

当任一位置的A/T比例与G/C比例相差超过10%,报'WARN';当任一位置的A/T比例与G/C比例相差超过20%,报'FAIL'

重新用fastqc检测进行过滤后的reads质量

附注,处理信息

出现了一个报错

与python有关;解决方案

https://www.cnblogs.com/lovebing/p/13048948.html

https://blog.csdn.net/qq_41185868/article/details/82079079

########暂时没有解决!

其他软件:

数据过滤之 Trimmomatic 详细说明


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/8166955.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-14
下一篇 2023-04-14

发表评论

登录后才能评论

评论列表(0条)

保存