1. 在Linux系统中(或虚拟系统)通过cd命令进入文件夹(路径);
2. 用FLASH工具:flash subsample_r1.fq subsample_r2.fq -m 200 -M 280 -o merged
3.提取barcode: extract_barcodes.py -f joined.extendedFrags.fastq -c barcode_single_end --bc1_len 6 -o processed_seqs
4. 割库:split_libraries.py -m mapping.txt -b 10 -l 250 -f merged.extendedFrags.fastq_fasta -o split_library_out
5. OTU分类:pick_otus.py -i split_library_out/chimera_filtered_seqs.fna -o picked_otus/
到这里就可以得到biom文件了
6. 得到分类信息:biom summarize-table -i sorted_otu_table.biom -o seqs_per_sample.txt
三、质量控制该步骤的质量控制主要包括三个方面:去除嵌合体、去除单一序列、去除非细菌序列和叶绿体序列。
1、去除嵌合体序列
去除嵌合体序列主要包括:嵌合体序列的确定、从序列文件中删除嵌合体和从OTU table中删除嵌合体。
(1)嵌合体序列的确定:
QIIME中提供了identify_chimeric_seqs.py命令以确定嵌合体,方法主要有ChimeraSlayer和USEARCH 6.1两种,但是,经尝试,速度均很慢,所以可以直接使用Mother中UCHIME方法确定嵌合体。使用上面第三步得到的Alignment序列,进行嵌合体确定,嵌合体序列被记录在.accnos文件中,将文件后缀改为.txt得到chimeraID.txt文件。
(2)从序列文件中删除嵌合体
-s选项为只包含序列名的文件(例如上步得到的chimeraID.txt),加上-n选项表示从序列文件中删去该文件中出现的序列,不加-n选项则表示只保留这部分序列。
(3)从OTU table中删除嵌合体
两种方法可以实现:
一是重新生成新的OTU table,在上面第七步make_otu_table.py中加入去除嵌合体的选项:
二是在第七步得到的OTU table中删除:
2、去除单一序列:
单一序列(Singleton)是指在所有测序结果中只包含一条序列的OTU,针对OTU table *** 作同样使用filter_otus_from_otu_table.py命令进行去除:
3、去除非细菌序列和叶绿体序列:
根据进化分类的信息,仅保留细菌序列,同时去除叶绿体序列,使用filter_taxa_from_otu_table.py命令 *** 作:
其中-p选项为仅保留,-n选项为去除,注意k和c后面为连续两条下划线。
当然,2、3两步只是针对OTU table进行处理,如果需要针对.fasta序列文件删除该部分序列,可以通过filter_fasta.py结合OTU table的biom文件实现:
这样得到的序列文件就可以重新进行上面第二项中的5、6两小步,即对齐、剪切、建树。
四、Biom格式的OTU table *** 作
经过质控后,我们最终得到了OTU table,这是下游分析的基础。
(1)Biom格式的OTU table描述:
执行该命令可以得到OTU table的一些基本信息,包括各样品包含的序列条数等。
(2)为方便后续使用其他软件进行统计分析,需要将Biom格式OTU table转化为.txt的文本格式:
1.创建工作目录,工作目录下存放公司处理过的 cleandata 和 mapping.txt
2.使用 validate_mapping_file.py 验证 mapping.txt 格式是否正确
在文件管理中找到该.html文件,双击打开
由于是 cleandata,故不需要填写 barcode 和 prime 信息
3.使用 split_libraries_fastq.py 切分数据(主要目的:得到seqs.fna)
4.使用 pick_otus.py 进行OTU聚类
5.使用 pick_rep.set.py 选择代表性OTU序列
6.使用 align_seqs.py 进行多序列比对
7.使用 filter_alignment.py 过滤比对结果
8.使用 make_phylogeny.py 构建进化树
9.使用 assign_taxonomy.py 进行物种分类注释
10.使用 make_otu_table.py 生成 OTUs table
11.使用 biom convert 将转换biom文件格式为txt格式
12.使用 biom convert 统计 otu_table.biom
13.处理 OTU table
1)按mapping文件顺序排序
2)过滤 OTU 数量大于1
3)删除异常样品
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)