如何在debian中装snv服务器

如何在debian中装snv服务器,第1张

SVN在服务器端的存储方式和客户端是不一样的,所以在服务器端是看不到源文件的。服务器端则派有两种存储方式FSFS和BDB,目前默认都是FSFS。 要导入文件有两种做法册渣: 1、用import指令,将客户端文件夹导入到服务孙姿贺器端 2、先checkout空库到客户端,然后...

用bwa和samtools做常规处理,再分别用GATK4.0和GATK3.5的HC去Call SNV,均使用默认参数。

GATK4.0明显比GATK3.5 Call出的SNV的数量多。

vep -i merge_sort_dedup_GATK_v4.0.vcf -o tmp4.out --cache --cache_version 82 --offline --vcf vep注释命令

通过vep分别对GATK4.0和GATK3.5的SNV注释,统计属于外显子的SNV的数量。

同样的,注释后GATK4.0还是明显比GATK3.5 Call出的SNV的数量多。

GATK4.0和缺睁运GATK3.5分别有自己的VQSR,有相同的地方也有不同的,也都用默认参数。

注: 分别用的是自己软件的VQSR

grep -v ^# merge_sort_dedup_GATK_v4.0.vqsr.vcf |grep PASS|awk '{split($10,a,":")if(a[3]>=10){print $0}}' | wc -l

对VQSR前后的数据进行DP的筛选,在GATK4.0和GATK3.5中,在不同的DP过滤下,统计Call出的SNV的数量。

注: 两个软件生成的vcf文件都是用的GATK3.5的VQSR,以去除不同软件不同VQSR的影响。

VQSR前后的SNV的数量都随着DP值的增加而减少,减少到一定值后趋于平缓。

当DP>=4/5 之后,GATK4.0和GATK3.5 Call出的SNV的数量已经比较接近并趋于平缓。

VQSR后,GATK4.0和GATK3.5 Call出的SNV的数量比VQSR之前Call出的SNV数量更接近。

说明VQSR对GATK4.0和GATK3.5 Call出SNV的数量的影响比较早凳大,通过调整VQSR的具体参数可减少软件间的差异。

另, VQSR中伏梁,当分析外显子测序数据时,不要用 -an DP 这个参数,因为深度对外显子测序数据影响比较大。

VQSR前后的SNV的数量都随着DP值的增加而减少,减少到一定值后趋于平缓。

我们取DP>=10时的两软件Call出的SNV数量分别做VQSR前和VQSR后的韦恩图。

注: 两个软件生成的vcf文件都是用的GATK3.5的VQSR,以去除不同软件不同VQSR的影响。

红色的是基本参数,蓝色的是变化,其中明显变化是,GATK4.0的VQSR将snp和indel合并处理,而GATK3.5则是分开的。

GATK4.0和GATK3.5针对Call SNV数量上的差异主要在于外显子测序数据的DP值比较低,导致两个软件对于低DP值Call出的SNV保留与否存在差异,GATK4.0有更大的包容性。我们可以通过VQSR的参数设置,针对DP值做详细的筛选过滤,来缩小两个软件间的差异。

补充:

GATK4 速度:

https://gatkforums.broadinstitute.org/gatk/discussion/11283/gatk3-8-vs-gatk4-va-gatk4spark-the-newer-the-slower

HC在GATK4和GATK3:

https://gatkforums.broadinstitute.org/gatk/discussion/9957/haplotypecaller-in-gatk4-vs-gatk3

GATK4的云流程:

https://help.aliyun.com/document_detail/60414.html?spm=5176.11065259.1996646101.searchclickresult.14c51b0bIlpQgI

Performance benchmarking of GATK3.8 and GATK4:

https://www.biorxiv.org/content/biorxiv/early/2018/06/18/348565.full.pdf

生成patch文件:

svn diff >patchFile /蠢源/ 整个工程的变动生成patch

或svn diff file >patchFile // 某个文件单独变动的patch

svn回滚:

svn revert FILE // 单个文件回滚

svn revert DIR --depth=infinity // 整个目拆芦录进行递归回滚

打patch:

patch -p0 <test.patch // -p0 选项要从当前目录查找目的文件(夹)

patch -p1 <test.patch // -p1 选项要从当前目录查找目的文件,不包含patch中的最上级目录(夹)

例如两个版本以a,b开头,而a,b并不是真正有效旅档带地代码路径,则这时候需要使用"-p1"参数。

a/src/...

b/src/...


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12170632.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存