啤酒公司所讲设备的EBI是什么?作用和原理?

啤酒公司所讲设备的EBI是什么?作用和原理?,第1张

EBI-empty bottle inspector 空瓶检测仪
空瓶检测仪是目前广泛应用于啤酒、饮料、白酒等行业,用于对被灌装容器进行检测的一种设备,可检测玻璃瓶和PET瓶。其主要检测瓶的瓶口、瓶身和瓶底,目前检测原理是采用摄像技术,即将生产线的每台瓶子进行拍照与设备程序中的图像进行对比,与程序不对应的即不符合要求的瓶子被剔除,一般EBI上会配置4台摄像机,即瓶口、瓶底各1台,瓶身2台(进EBI之前有1台,之后有1台),再通过光源镜,可做到360度检测,但目前的EBI对瓶身雕花(logo)技术检测还不成熟;EBI一般会配置三个剔除器,进EBI之前对异形瓶进行剔除,EBI之后对毛口瓶和清洗不净瓶分别使用剔除器进行剔除,剔除器目前有单指和多指2种,克朗斯目前只提供单指剔除器。

蛋白质数据库
1 PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,包含超过142,000条蛋白质序列(至99年9月),其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
PIR和PSD的网址是:>命令行:

hisat2-build[options]

注意:

       如果使用--snp,--ss和/或--exon选项,hisat2-build将需要大约200GB的运行内存来满足人类基因组规模大小的基因组的索引构建,因为建立索引涉及到graph construction。否则,就可以用8GB的运行内存在个人电脑构建索引了。

主要参数

<reference_in>

       以逗号分隔的FASTA文件列表,其中包含要比对的参考序列,例如chr1fa,chr2fa,chrXfa,chrYfa;如果指定了-c,则可以具体的GGTCATCCT,ACGGGTCGT,CCGTTCTATGCGGCTTA序列。

<ht2_base>

       要写入的索引文件的basename;默认情况下,hisat2-build写入文件名为NAME1ht2, NAME2ht2, NAME3ht2, NAME4ht2, NAME5ht2, NAME6ht2, NAME7ht2, NAME8ht2的文件。<ht2_base>就是文件前缀NAME。

选项

1-f

参考基因组输入文件(指定为<reference_in>_)是FASTA文件(通常具有fa、mfa、fna或类似的扩展名)。

2-c

在命令行上给出参考序列。也就是说<reference_in>是一个逗号分隔的序列列表,而不是一个FASTA文件列表。

3--large-index

强制hisat2-build建立一个大的索引,即使参考的长度小于~ 40亿个核苷酸。

4-a/--noauto

禁用hisat2-build根据可用内存自动选择--bmax,--dcv和[--packed]参数的这一默认行为。相反,用户可以为这些参数指定值。如果内存在构建索引期间耗尽,将输出错误信息;由用户决定是否尝试新的参数。

5--bmax

block 中允许的最大后缀数。允许每个block使用更多的后缀可以加快索引构建速度,但会增加内存的峰值使用。设置此选项将覆盖以前对--bmax或--bmaxdivn的任何设置。--bmaxdivn默认值是4。这是默认自动配置的;使用-a/- noauto则可以手动配置。

6--bmaxdivn

block中允许的最大后缀数,表示为参考序列长度的一部分。设置此选项将覆盖以前对--bmax或--bmaxdivn的任何设置。默认值: --bmaxdivn 4。这是默认自动配置的;使用-a/- noauto则可以手动配置。

7--dcv

使用<int>作为 difference-cover 样本的period。较大的period产生较少的内存开销,但可能使后缀排序变慢,特别是如果存在重复。必须是2的整数幂且必须不大于4096。默认值:1024。这是默认自动配置的;使用-a/- noauto手动配置。

8--nodc

禁用difference-cover样本的使用。在最坏的情况下(最坏的情况是极度重复的参考序列),后缀排序变成了二次排序。默认值:关闭。

9-r/--noref

不要构建名称为NAME3ht2 、NAME4ht2的索引部分,它包含参考序列的bitpacked版本, 用于双端测序的比对。

10-3/--justref

只构建名称为NAME3ht2 、NAME4ht2的索引部分,它包含引用序列的bitpacked版本,用于双端测序的比对。

11-o/--offrate <int>

为了将比对结果映射回参考序列上,有必要用基因组上相应位置标注(标记)部分或全部的Burrows-Wheeler

rows。-o/- offrate统计有多少行被标记:索引器将标记每2^<int>行。标记更多的行可以使序列-位置查找更快,但是需要更多的内存来在运行时保存注释。默认值为4(每16行标记一次;对于人类基因组来说,注释大约有680兆字节)。

12-t/--ftabchars

ftab是用于计算的第一个<int>字符的初始Burrows-Wheeler范围的查找表。较大的<int>将生成较大的查找表,但查询时间更快。ftab的大小为4^(<int>+1)字节。默认设置为10 (ftab为4MB)。

13--localoffrate

这个选项统计在本地索引中标记多少行:索引器将标记每2^<int>行。标记更多的行可以使引用位置查找更快,但是需要更多的内存来在运行时保存注释。默认值为3(每标记第8行,每个本地索引大约占用16KB)。

14--localftabchars

本地ftab是本地索引中的查找表。默认设置为6 (ftab为每个本地索引8KB)。

15-p

并行运算线程数(默认:1)。

16--snp

提供一个snp列表(HISAT2自己的格式),如下(五列)。

SNPID snp type (single, deletion, or insertion) chromosomename zero-offset based genomic position of a SNP alternative base (single), the length of SNP (deletion), or insertion sequence(insertion)

例如:rs58784443,single,13,18447947,T

hisat2_extract_snps_haplotypes_UCSCpy(在HISAT2包中)从dbSNP文件(例如>

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zz/10566738.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-09
下一篇 2023-05-09

发表评论

登录后才能评论

评论列表(0条)

保存