空瓶检测仪是目前广泛应用于啤酒、饮料、白酒等行业,用于对被灌装容器进行检测的一种设备,可检测玻璃瓶和PET瓶。其主要检测瓶的瓶口、瓶身和瓶底,目前检测原理是采用摄像技术,即将生产线的每台瓶子进行拍照与设备程序中的图像进行对比,与程序不对应的即不符合要求的瓶子被剔除,一般EBI上会配置4台摄像机,即瓶口、瓶底各1台,瓶身2台(进EBI之前有1台,之后有1台),再通过光源镜,可做到360度检测,但目前的EBI对瓶身雕花(logo)技术检测还不成熟;EBI一般会配置三个剔除器,进EBI之前对异形瓶进行剔除,EBI之后对毛口瓶和清洗不净瓶分别使用剔除器进行剔除,剔除器目前有单指和多指2种,克朗斯目前只提供单指剔除器。蛋白质数据库
1 PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,包含超过142,000条蛋白质序列(至99年9月),其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
PIR和PSD的网址是:>命令行:
hisat2-build[options]
注意:
如果使用--snp,--ss和/或--exon选项,hisat2-build将需要大约200GB的运行内存来满足人类基因组规模大小的基因组的索引构建,因为建立索引涉及到graph construction。否则,就可以用8GB的运行内存在个人电脑构建索引了。
主要参数
<reference_in>
以逗号分隔的FASTA文件列表,其中包含要比对的参考序列,例如chr1fa,chr2fa,chrXfa,chrYfa;如果指定了-c,则可以具体的GGTCATCCT,ACGGGTCGT,CCGTTCTATGCGGCTTA序列。
<ht2_base>
要写入的索引文件的basename;默认情况下,hisat2-build写入文件名为NAME1ht2, NAME2ht2, NAME3ht2, NAME4ht2, NAME5ht2, NAME6ht2, NAME7ht2, NAME8ht2的文件。<ht2_base>就是文件前缀NAME。
选项
1-f
参考基因组输入文件(指定为<reference_in>_)是FASTA文件(通常具有fa、mfa、fna或类似的扩展名)。
2-c
在命令行上给出参考序列。也就是说<reference_in>是一个逗号分隔的序列列表,而不是一个FASTA文件列表。
3--large-index
强制hisat2-build建立一个大的索引,即使参考的长度小于~ 40亿个核苷酸。
4-a/--noauto
禁用hisat2-build根据可用内存自动选择--bmax,--dcv和[--packed]参数的这一默认行为。相反,用户可以为这些参数指定值。如果内存在构建索引期间耗尽,将输出错误信息;由用户决定是否尝试新的参数。
5--bmax
block 中允许的最大后缀数。允许每个block使用更多的后缀可以加快索引构建速度,但会增加内存的峰值使用。设置此选项将覆盖以前对--bmax或--bmaxdivn的任何设置。--bmaxdivn默认值是4。这是默认自动配置的;使用-a/- noauto则可以手动配置。
6--bmaxdivn
block中允许的最大后缀数,表示为参考序列长度的一部分。设置此选项将覆盖以前对--bmax或--bmaxdivn的任何设置。默认值: --bmaxdivn 4。这是默认自动配置的;使用-a/- noauto则可以手动配置。
7--dcv
使用<int>作为 difference-cover 样本的period。较大的period产生较少的内存开销,但可能使后缀排序变慢,特别是如果存在重复。必须是2的整数幂且必须不大于4096。默认值:1024。这是默认自动配置的;使用-a/- noauto手动配置。
8--nodc
禁用difference-cover样本的使用。在最坏的情况下(最坏的情况是极度重复的参考序列),后缀排序变成了二次排序。默认值:关闭。
9-r/--noref
不要构建名称为NAME3ht2 、NAME4ht2的索引部分,它包含参考序列的bitpacked版本, 用于双端测序的比对。
10-3/--justref
只构建名称为NAME3ht2 、NAME4ht2的索引部分,它包含引用序列的bitpacked版本,用于双端测序的比对。
11-o/--offrate <int>
为了将比对结果映射回参考序列上,有必要用基因组上相应位置标注(标记)部分或全部的Burrows-Wheeler
rows。-o/- offrate统计有多少行被标记:索引器将标记每2^<int>行。标记更多的行可以使序列-位置查找更快,但是需要更多的内存来在运行时保存注释。默认值为4(每16行标记一次;对于人类基因组来说,注释大约有680兆字节)。
12-t/--ftabchars
ftab是用于计算的第一个<int>字符的初始Burrows-Wheeler范围的查找表。较大的<int>将生成较大的查找表,但查询时间更快。ftab的大小为4^(<int>+1)字节。默认设置为10 (ftab为4MB)。
13--localoffrate
这个选项统计在本地索引中标记多少行:索引器将标记每2^<int>行。标记更多的行可以使引用位置查找更快,但是需要更多的内存来在运行时保存注释。默认值为3(每标记第8行,每个本地索引大约占用16KB)。
14--localftabchars
本地ftab是本地索引中的查找表。默认设置为6 (ftab为每个本地索引8KB)。
15-p
并行运算线程数(默认:1)。
16--snp
提供一个snp列表(HISAT2自己的格式),如下(五列)。
SNPID snp type (single, deletion, or insertion) chromosomename zero-offset based genomic position of a SNP alternative base (single), the length of SNP (deletion), or insertion sequence(insertion)
例如:rs58784443,single,13,18447947,T
hisat2_extract_snps_haplotypes_UCSCpy(在HISAT2包中)从dbSNP文件(例如>
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)