QIIME中做16srDNA测序数据分析out_tablleBMP.biom文件如何生成?

QIIME中做16srDNA测序数据分析out_tablleBMP.biom文件如何生成?,第1张

步骤如下:

1. 在Linux系统中(或虚拟系统)通过cd命令进入文件夹(路径);

2. 用FLASH工具:flash subsample_r1.fq subsample_r2.fq -m 200 -M 280 -o merged

3.提取barcode: extract_barcodes.py -f joined.extendedFrags.fastq -c barcode_single_end --bc1_len 6 -o processed_seqs

4. 割库:split_libraries.py -m mapping.txt -b 10 -l 250 -f merged.extendedFrags.fastq_fasta -o split_library_out

5. OTU分类:pick_otus.py -i split_library_out/chimera_filtered_seqs.fna -o picked_otus/

到这里就可以得到biom文件了

6. 得到分类信息:biom summarize-table -i sorted_otu_table.biom -o seqs_per_sample.txt

三、质量控制

该步骤的质量控制主要包括三个方面:去除嵌合体、去除单一序列、去除非细菌序列和叶绿体序列。

1、去除嵌合体序列

去除嵌合体序列主要包括:嵌合体序列的确定、从序列文件中删除嵌合体和从OTU table中删除嵌合体。

(1)嵌合体序列的确定:

QIIME中提供了identify_chimeric_seqs.py命令以确定嵌合体,方法主要有ChimeraSlayer和USEARCH 6.1两种,但是,经尝试,速度均很慢,所以可以直接使用Mother中UCHIME方法确定嵌合体。使用上面第三步得到的Alignment序列,进行嵌合体确定,嵌合体序列被记录在.accnos文件中,将文件后缀改为.txt得到chimeraID.txt文件。

(2)从序列文件中删除嵌合体

-s选项为只包含序列名的文件(例如上步得到的chimeraID.txt),加上-n选项表示从序列文件中删去该文件中出现的序列,不加-n选项则表示只保留这部分序列。

(3)从OTU table中删除嵌合体

两种方法可以实现:

一是重新生成新的OTU table,在上面第七步make_otu_table.py中加入去除嵌合体的选项:

二是在第七步得到的OTU table中删除:

2、去除单一序列:

单一序列(Singleton)是指在所有测序结果中只包含一条序列的OTU,针对OTU table *** 作同样使用filter_otus_from_otu_table.py命令进行去除:

3、去除非细菌序列和叶绿体序列:

根据进化分类的信息,仅保留细菌序列,同时去除叶绿体序列,使用filter_taxa_from_otu_table.py命令 *** 作:

其中-p选项为仅保留,-n选项为去除,注意k和c后面为连续两条下划线。

当然,2、3两步只是针对OTU table进行处理,如果需要针对.fasta序列文件删除该部分序列,可以通过filter_fasta.py结合OTU table的biom文件实现:

这样得到的序列文件就可以重新进行上面第二项中的5、6两小步,即对齐、剪切、建树。

四、Biom格式的OTU table *** 作

经过质控后,我们最终得到了OTU table,这是下游分析的基础。

(1)Biom格式的OTU table描述:

执行该命令可以得到OTU table的一些基本信息,包括各样品包含的序列条数等。

(2)为方便后续使用其他软件进行统计分析,需要将Biom格式OTU table转化为.txt的文本格式:

1.创建工作目录,工作目录下存放公司处理过的 cleandata 和 mapping.txt

2.使用 validate_mapping_file.py 验证 mapping.txt 格式是否正确

在文件管理中找到该.html文件,双击打开

由于是 cleandata,故不需要填写 barcode 和 prime 信息

3.使用 split_libraries_fastq.py 切分数据(主要目的:得到seqs.fna)

4.使用 pick_otus.py 进行OTU聚类

5.使用 pick_rep.set.py 选择代表性OTU序列

6.使用 align_seqs.py 进行多序列比对

7.使用 filter_alignment.py 过滤比对结果

8.使用 make_phylogeny.py 构建进化树

9.使用 assign_taxonomy.py 进行物种分类注释

10.使用 make_otu_table.py 生成 OTUs table

11.使用 biom convert 将转换biom文件格式为txt格式

12.使用 biom convert 统计 otu_table.biom

13.处理 OTU table

1)按mapping文件顺序排序

2)过滤 OTU 数量大于1

3)删除异常样品


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/8124929.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-13
下一篇 2023-04-13

发表评论

登录后才能评论

评论列表(0条)

保存