啤酒公司所讲设备的EBI是什么？作用和原理？_服务器

EBI-empty bottle inspector 空瓶检测仪
空瓶检测仪是目前广泛应用于啤酒、饮料、白酒等行业，用于对被灌装容器进行检测的一种设备，可检测玻璃瓶和PET瓶。其主要检测瓶的瓶口、瓶身和瓶底，目前检测原理是采用摄像技术，即将生产线的每台瓶子进行拍照与设备程序中的图像进行对比，与程序不对应的即不符合要求的瓶子被剔除，一般EBI上会配置4台摄像机，即瓶口、瓶底各1台，瓶身2台（进EBI之前有1台，之后有1台），再通过光源镜，可做到360度检测，但目前的EBI对瓶身雕花（logo）技术检测还不成熟；EBI一般会配置三个剔除器，进EBI之前对异形瓶进行剔除，EBI之后对毛口瓶和清洗不净瓶分别使用剔除器进行剔除，剔除器目前有单指和多指2种，克朗斯目前只提供单指剔除器。

蛋白质数据库
1 PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库，包含超过142,000条蛋白质序列(至99年9月)，其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理，超过99%的序列已按蛋白质家族分类，一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引，以及数据库内部条目之间的索引，这些内部索引帮助用户在包括复合物、酶－底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库，每周可以得到更新部分。
PSD数据库有几个辅助数据库，如基于超家族的非冗余库等。PIR提供三类序列搜索服务：基于文本的交互式检索；标准的序列相似性搜索，包括BLAST、FASTA等；结合序列相似性、注释信息和蛋白质家族信息的高级搜索，包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
PIR和PSD的网址是：>命令行：

hisat2-build[options]

注意：

如果使用--snp，--ss和/或--exon选项，hisat2-build将需要大约200GB的运行内存来满足人类基因组规模大小的基因组的索引构建，因为建立索引涉及到graph construction。否则，就可以用8GB的运行内存在个人电脑构建索引了。

主要参数

<reference_in>

以逗号分隔的FASTA文件列表，其中包含要比对的参考序列，例如chr1fa，chr2fa，chrXfa，chrYfa；如果指定了-c，则可以具体的GGTCATCCT，ACGGGTCGT，CCGTTCTATGCGGCTTA序列。

<ht2_base>

要写入的索引文件的basename；默认情况下，hisat2-build写入文件名为NAME1ht2, NAME2ht2, NAME3ht2, NAME4ht2, NAME5ht2, NAME6ht2, NAME7ht2, NAME8ht2的文件。<ht2_base>就是文件前缀NAME。

选项

1-f

参考基因组输入文件(指定为<reference_in>_)是FASTA文件(通常具有fa、mfa、fna或类似的扩展名)。

2-c

在命令行上给出参考序列。也就是说<reference_in>是一个逗号分隔的序列列表，而不是一个FASTA文件列表。

3--large-index

强制hisat2-build建立一个大的索引，即使参考的长度小于~ 40亿个核苷酸。

4-a/--noauto

禁用hisat2-build根据可用内存自动选择--bmax，--dcv和[--packed]参数的这一默认行为。相反，用户可以为这些参数指定值。如果内存在构建索引期间耗尽，将输出错误信息；由用户决定是否尝试新的参数。

5--bmax

block 中允许的最大后缀数。允许每个block使用更多的后缀可以加快索引构建速度，但会增加内存的峰值使用。设置此选项将覆盖以前对--bmax或--bmaxdivn的任何设置。--bmaxdivn默认值是4。这是默认自动配置的；使用-a/- noauto则可以手动配置。

6--bmaxdivn

block中允许的最大后缀数，表示为参考序列长度的一部分。设置此选项将覆盖以前对--bmax或--bmaxdivn的任何设置。默认值: --bmaxdivn 4。这是默认自动配置的；使用-a/- noauto则可以手动配置。

7--dcv

使用<int>作为 difference-cover 样本的period。较大的period产生较少的内存开销，但可能使后缀排序变慢，特别是如果存在重复。必须是2的整数幂且必须不大于4096。默认值:1024。这是默认自动配置的；使用-a/- noauto手动配置。

8--nodc

禁用difference-cover样本的使用。在最坏的情况下(最坏的情况是极度重复的参考序列)，后缀排序变成了二次排序。默认值:关闭。

9-r/--noref

不要构建名称为NAME3ht2 、NAME4ht2的索引部分，它包含参考序列的bitpacked版本，用于双端测序的比对。

10-3/--justref

只构建名称为NAME3ht2 、NAME4ht2的索引部分，它包含引用序列的bitpacked版本，用于双端测序的比对。

11-o/--offrate <int>

为了将比对结果映射回参考序列上，有必要用基因组上相应位置标注(标记)部分或全部的Burrows-Wheeler

rows。-o/- offrate统计有多少行被标记:索引器将标记每2^<int>行。标记更多的行可以使序列-位置查找更快，但是需要更多的内存来在运行时保存注释。默认值为4(每16行标记一次；对于人类基因组来说，注释大约有680兆字节)。

12-t/--ftabchars

ftab是用于计算的第一个<int>字符的初始Burrows-Wheeler范围的查找表。较大的<int>将生成较大的查找表，但查询时间更快。ftab的大小为4^(<int>+1)字节。默认设置为10 (ftab为4MB)。

13--localoffrate

这个选项统计在本地索引中标记多少行:索引器将标记每2^<int>行。标记更多的行可以使引用位置查找更快，但是需要更多的内存来在运行时保存注释。默认值为3(每标记第8行，每个本地索引大约占用16KB)。

14--localftabchars

本地ftab是本地索引中的查找表。默认设置为6 (ftab为每个本地索引8KB)。

15-p

并行运算线程数(默认:1)。

16--snp

提供一个snp列表(HISAT2自己的格式)，如下(五列)。

SNPID snp type (single, deletion, or insertion) chromosomename zero-offset based genomic position of a SNP alternative base (single), the length of SNP (deletion), or insertion sequence(insertion)

例如：rs58784443，single，13，18447947，T

hisat2_extract_snps_haplotypes_UCSCpy(在HISAT2包中)从dbSNP文件(例如>

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/zz/10566738.html

啤酒公司所讲设备的EBI是什么？作用和原理？

发表评论

评论列表（0条）