RDBMS 关系型DBMS
Record(记录) 同元组(Tuple)
Recovery control(恢复控制) 当时百事 将数据库还原到正确状态的过程
Rcursive relationship(递归关系) 一种关系 挡同一个实体在不同的角色中参与多次时就会出现递归关系 例如Staff Supervises Staff
redundant data(冗余数据) 在多个表中存储的重复数据
Referential integrity(参照完整性) 如果一个表中存在外健 则外健值必须匹配主表中的某些记录的候选键的值
Relation(关系) 一个关系是一张表 它也有列和行
Relational model(关系模型) 以表(或关系)的形式表示数据的数据模型
Relational database(关系数据库) 规范化表的集合
Relation(关系) 实体间有意义的关系
Relationship occurrence(关系出现) 两个实体出现之间的唯一可标识的联系
Requirements collection and *** ysis(需求收集于分析) 数据库应用程序生命周期的一个阶段 包括收集和分析数据库应用程序所要支持的关于公司的信息 并使用这些信息来标识新的数据库应用需求
Row(行) 同元组(Tuple)
Second normal form(第二范式) 一个已经是第一范式的表 同时满足所有的非主健列只能从构成主健的全部列中获得
Secondary index(二级索引) 在数据文件的非有序字段上定义的索引
Security(安全) 指防止数据库被非授权的用户访问 包括有意的和无意的 RDBMS通常提供两种类型的安全 数据安全和系统安全
Server(服务器) 为发出请求的客户提供服务的软件应用程序 参见两层/三层客户端 服务器体系结构
Simple attribute(简单属性) 只有一个组件的属性
Single valued attribute(单值属性) 对于一个实体出现只有一个值的属性
Specialization(特化) 通过标识用来区分实体间成员的特征来最大花实体间成员的差别的过程
Specialization hierarchy(特化层次结构) 同类型层次结构(Type hierarchy)
SQL(Structured Query Language 结构化查询语言) 一种用于RDBMS的非过程化数据库语言 换言之 你只需要指定你需要那些信息 而不需要指定如何得到这些信息 SQL已经被国际标准化组织(ISO)标准化了 因此SQL是定义和 *** 纵RDBMS的正式和实际上的标准语言
Strong entity(强实体) 一个不依赖于其他实体的主健的存在而存在的实体
Subclass(子类) 为(超类)实体中的某些出现并保持特定属性和关系并有不同角色的实体
Superclass(超类) 为实体中的所有出现保存公共属性和关系的实体 可参见特化和泛化
Superkey(超键 ER模型) 一个属性或属性集 诶译的标识了每个实体地出现
Superkey(超键 关系模型) 一个列或者列集 唯一的标识了表中地一个记录
System catalog(系统目录) 保存关于数据库地结构 用户 应用程序等信息地数据
System definition(系统定义) 数据库应用声明周期重的一个阶段 包括定义数据库应用程序以及他的主要用户视图地范围和边界
System security(系统安全) 在系统级保护数据库地访问和使用 不如用户名和密码
Table(表) 同关系(relation)
Ternary relationship(三元关系) 三个实体间的关系 例如panch staff和member之间的Registers关系
Testing(测试) 数据库应用生命周期的一个阶段 包括执行应用程序并有意地发现错误
Third normal form NF(第三范式) 一个已经是 NF和 NF的表 同时满足所有的非主健的列的值仅能从主健列得到 而不能从其他列得到
GL Third Generation Language(第三代语言) 一种过程化的语言 比如COBOL C C++ 它需要用户(通常是程序员)指定必须要干什么事情以及如何干这些事情
Three tier client server architecture(三层客户端 服务器体系结构) 由处理用户界面的客户和处理业务逻辑的应用程序服务器以及数据处理曾组成 而数据库服务器是用来来运行DBMS的
Top down approach(自顶向下方法 用于数据库设计) 一种设计方法 此种方法从定义系统的主要结构开始 然后将这些结构逐步细分成更小的单元 在数据库设计中 通过标识实体和数据间的关系开始这个顶层的步骤 然后逐步添加细节 比如你希望保存的关于实体和关系的信息(成为属性)以及在实体 关系和属性上的所有约束
Transaction(事务) 由用户和应用程序执行的一个动作或一系列动作 这些动作访问或修改数据库的内容
Transaction Processing Monitor TPM(事务处理监视器) 控制数据在客户端和服务器键转换的程序 以便为联机事务处理(OLTP)提供一个一致的环境
Transitive dependency(传递依赖) 假设A B C是表中的列 如果B依赖于A(A >B) 并且C依赖于B(B >C) 则C通过B传递而依赖于A(假设A不依赖于B或C) 如果在主健上存在一个传递依赖 则此表就不是 NF的 必须从表中去掉传递依赖以达到 NF的要求
Tuple(元组) 关系中的一行记录
Two tier client server architecture(两层客户端 服务器体系结构) 由处理主要业务和数据处理逻辑以及与用户的接口的客户端应用程序和管理和控制数据库访问的服务器程序组成
Type hierarchy(类型层次结构) 一个是提以及它的子类和他们的超类 等等
UML(Unified Modeling Language 统一建模语言) 在 世纪 年代和 年代引入的诸多面向对象分析与设计方法重的一种较新的方法
Update anomalies(更新异常) 当用户视图更新一个包含冗余数据的标识可能引起的不一致 有三种类型的异常 插入 删除和更新
User view(用户视图) 从特定的作业(比如经理或管理者)角度或业务应用领域(比如市场 职员或库存控制)定义的数据库应用的需求
View(视图) 一个 虚拟底表 它不实际存在数据库中 但他由DBMS从现有底它所涉及的基本表中产生
View integration approach(视图综合法 用于数据库设计) 每个用户视图的需求 用来构建代表用户试图底独立数据模型 在数据库设计阶段 结果数据库模型被合并成一个更大的模型
lishixinzhi/Article/program/SQL/201311/16197大数据热门词汇汇总
可以说,大数据是如今IT行业最热门的趋势之一,它催生出了处理大数据的一批全新技术。而新技术带来了新的热门词汇:首字母缩略词、专业术语和产品名称等。连"大数据"这个短语本身都让人犯晕。许多人一听到"大数据",觉得是指"大量数据",而大数据的涵义绝不仅仅涉及数据量的多寡。
下面是我们认为你要熟悉的几个热门词汇,按字母顺序排列。
ACID
ACID的全称是原子性、一致性、隔离性和持久性,这其实是一组需求或属性:如果这四个方面都得到遵守,就能在处理过程中确保数据库事务的数据完整性。虽然ACID问世已有一段时日,但是事务数据量的急剧增长把更多的注意力投向在处理大数据时需要满足ACID的规定。
大数据三要素
如今的IT系统在生成数量、速度和种类都很"庞大"的数据。
数量:IDC公司估计,今年全球信息总量将达到2.7泽字节(这相当于27亿太字节),而且每两年就翻一番。
速度:让IT管理人员们头痛的不仅仅是数据数量,还有数据从金融系统、零售系统、网站、传感器、无线射频识别(RFID)芯片以及Facebook和推特等社交网络源源而来的速度越来越快。
种类:如果回到5年前或可能10年前,IT人员处理的主要是字母数字数据,它们很容易存储在关系数据库中整齐排列的行和列中。现在不再是这样了。如今,推特和Facebook上的帖子、各种文档及网页内容等非结构化数据都是大数据组合的一部分。
列式(或列型)数据库
一些新一代数据库(如开源Cassandra和惠普的Vertica数据库)被设计成了按列存储数据,而不是像传统的SQL数据库那样按行存储数据。这种设计提供了更快的磁盘访问速度,提高了处理大数据时的性能。对数据密集型业务分析应用系统而言,列式数据库尤其受到欢迎。
数据仓库
数据仓库这个概念存在至今已有大概25年了,具体指将数据从多个 *** 作IT系统复制到面向业务分析应用系统的辅助离线数据库
但是随着数据量急剧增长,数据仓库系统正在迅速改变。它们需要存储更多的数据以及更多种类的数据,因而数据仓库管理成为一大难题。10年或20年前,数据可能每周或每月复制到数据仓库系统中;而如今,数据仓库的更新要频繁得多,有的甚至实时更新。
ETL
将数据从一个数据库(比如支持银行应用事务处理系统的数据库)转移到另一个数据库(比如用于业务分析的数据仓库系统)时,就要用到提取、转换和加载(ETL)软件。数据从一个数据库传送到另一个数据库时,常常需要对数据进行重新格式化和清理 *** 作。
由于数据量急剧增长,数据处理速度大大加快,对ETL工具的性能要求也大大提高了。
Flume
Flume是属于Apache Hadoop大家族(其他技术包括HBase、Hive、Oozie、Pig和Whirr)的一项技术,这种框架用于为Hadoop填充数据。该技术使用散布于应用服务器、Web服务器、移动设备及其他系统上的软件代理,收集数据,并将数据传送到Hadoop系统。
比如说,公司可以使用在Web服务器上运行的Apache Flume,收集来自推特帖子的数据,以便分析。
地理空间分析
推动大数据潮流的一个趋势是,由如今的IT系统生成和收集的地理空间数据越来越多。常言道,一幅图片的信息量抵得上1000个单词;所以难怪越来越多的地图、图表、照片及其他基于地理位置的内容是导致如今大数据呈爆炸式增长的主要动因。
地理空间分析是一种特殊形式的数据可视化(参阅下面的"可视化"条目),在地理地图上覆盖数据,以帮助用户更清楚地理解大数据分析的结果。
Hadoop
Hadoop是一种开源平台,用于开发分布式、数据密集型的应用程序。它由Apache软件基金会控制。
Hadoop的发明者是雅虎公司的开发者道格o卡廷(Doug Cutting),他在谷歌实验室的MapReduce概念这个基础上开发出了Hadoop,以他儿子的玩具象命名。
另外,HBase是一种非关系数据库,它是作为Hadoop项目的一部分开发而成的。Hadoop分布式文件系统(HDFS)是Hadoop的一个关键组成部分。Hive则是建立在Hadoop基础上的数据仓库系统。
内存中数据库
计算机在处理事务或执行查询时,一般从磁盘驱动器获取数据。但是当IT系统处理大数据时,这个过程可能实在太慢。
内存中数据库系统利用计算机的主内存来存储经常使用的数据,因而大大缩短了处理时间。内存中数据库产品包括SAP HANA和甲骨文Times Ten内存中数据库。
Java
Java是一种编程语言,由现隶属甲骨文公司的Sun开发,于1995年发布。Hadoop和其他许多大数据技术都是使用Java开发而成的,它仍是大数据领域一种主要的开发技术。
Kafka
Kafka是一种高吞吐量的分布式消息传送系统,最初是在LinkedIn开发而成,用于管理该服务网站的活动流(关于网站使用情况的数据)和 *** 作数据处理流水线(关于服务器组件的性能)。
Kafka在处理大量流式数据时很有效,而流式数据是许多大数据计算环境的一个关键问题。由推特开发的Storm是另一种大行其道的流处理技术。
Apache软件基金会已将Kafka列为一个开源项目。所以,别以为这是有缺陷的软件。
延迟时间
延迟时间是指数据从一个点传送到另一个点过程中的延迟,或者是某个系统(如应用程序)响应另一个系统的延迟数量。
虽然延迟时间不是什么新术语,但是随着数据量不断增长,IT系统竭力跟上步伐,如今你更常听到这个术语。简单地说,"低延迟"是好事,"高延迟"是坏事。
映射/化简
映射/化简(Map/Reduce)这种方法是指把一个复杂的问题分解成多个较小的部分,然后将它们分发到多台计算机上,最后把它们重新组装成一个答案。
谷歌的搜索系统用到了映射/化简概念,这家公司有一个品牌名为MapReduce的框架。
谷歌在2004年发布的一份白皮书描述了它使用映射/化简的情况。Hadoop之父道格o卡廷充分认识到了其潜力,开发出了同样借用映射/化简概念的第一个版本的Hadoop。
NoSQL数据库
大多数主流的数据库(如甲骨文数据库和微软SQL Server)基于关系型体系结构,使用结构化查询语言(SQL)用于开发和数据管理。
但是名为"NoSQL"(有些人现在称NoSQL表示"不是只有SQL")的新一代数据库系统基于支持者们认为更适合处理大数据的体系结构。
一些NoSQL数据库是为提高可扩展性和灵活性设计的,另一些NoSQL数据库在处理文档及其他非结构化数据方面比较有效。典型的NoSQL数据库包括Hadoop/HBase、Cassandra、MongoDB和CouchDB,而甲骨文等一些知名开发商已推出了各自的NoSQL产品。
Oozie
Apache Oozie是一种开源工作流引擎,用于帮助管理面向Hadoop的处理工作。使用Oozie,一系列工作可以用多种语言(如Pig和MapReduce)来加以定义,然后彼此关联起来。比如说,一旦从 *** 作应用程序收集数据的作业已完成,程序员就可以启动数据分析查询任务。
Pig
Pig是Apache软件基金会的另一个项目,这个平台用于分析庞大的数据集。就其本质而言,Pig是一种编程语言,可用于开发在Hadoop上运行的并行计算查询。
定量数据分析
定量数据分析是指使用复杂的数学或统计模型,解释金融和商业行为,或者甚至预测未来的行为。
由于如今收集的数据量急剧增加,定量数据分析已变得更加复杂。但是如果公司知道如何利用海量数据,获得更好的可视性,深入了解公司业务,并且洞察市场发展趋势,那么更多的数据也有望在数据分析方面带来更多的机会。
一个问题是,拥有这种分析技能的人才严重匮乏。知名咨询公司麦肯锡表示,光美国就需要150万名拥有大数据分析技能的分析员和管理员。
关系数据库
关系数据库管理系统(RDBM)是如今使用最广泛的一种数据库,包括IBM的DB2、微软的SQL Server和甲骨文数据库。从银行应用系统、零售店的销售点系统到库存管理应用软件,大多数的企业事务处理系统都在RDBM上运行。
但有些人认为,关系数据库可能跟不上如今数据量和种类都呈爆炸式增长的形势。比如说,RDBM当初在设计时着眼于处理字母数字数据,处理非结构化数据时不是同样有效。
分片
随着数据库变得越来越庞大,处理起来也变得越来越困难。分片(sharding)是一种数据库分区技术,把数据库分成了更小、更容易管理的部分。具体来说,数据库被横向分区,以便单独管理数据库表中的不同行。
分片方法让庞大数据库的片段可以分布在多台服务器上,从而提高数据库的整体运行速度和性能。
另外,Sqoop是一种开源工具,用于将来自非Hadoop来源(如关系数据库)的数据转移到Hadoop环境。
文本分析
导致大数据问题的因素之一是,从推特和Facebook等社交媒体网站、外部新闻源,甚至公司内部收集而来以便分析的文本数量越来越多。由于文本是非结构化数据(不像通常存储在关系数据库中的结构化数据),主流的业务分析工具面对文本时常常束手无策。
文本分析采用了一系列方法(关键字搜索、统计分析法和语言研究法等),从基于文本的数据中获得洞察力。
非结构化数据
就在不久前,大部分数据还是结构化数据,这种字母数字信息(如来自销售交易的财务数据)很容易存储在关系数据库中,并由商业智能工具来分析。
但是如今共计2.7泽字节的存储数据中很大一部分是非结构化数据,比如基于文本的文档、推特消息、发布在Flickr上的照片、发布在YouTube上的视频,等等。(颇有意思的是,每分钟有长达35个小时的视频内容上传到YouTube。)处理、存储和分析所有这些凌乱的非结构化数据常常是如今的IT系统面临的难题。
可视化
随着数据量的增长,人们使用静态的图表和图形来理解数据越来越困难了。这就导致开发新一代的数据可视化和分析工具,能够以新的方式呈现数据,从而帮助人们理解海量信息。
这些工具包括:标以色码的热图,三维图形,显示一段时间内变化的动画可视化,以及在地理地图上覆盖数据的地理空间呈现。今天的先进数据可视化工具还具有更强的互动性,比如允许用户放大某个数据子集,进行更仔细的检查。
Whirr
Apache Whirr是一组Java类库,用于运行大数据云服务。更确切地说,它可以加快在亚马逊d性计算云(EC2)和Rackspace等虚拟基础设施上开发Hadoop集群的过程。
XML
可扩展标记语言(XML)用来传输和存储数据(别与HTML混为一谈,后者用来显示数据)。借助XML,程序员们就可以创建通用的数据格式,并通过互联网共享信息和格式。
由于XML文档可能非常庞大、复杂,它们往往被认为导致IT部门面临大数据挑战。
尧字节
尧字节(yottabyte)是一种数据存储度量指标,相当于1000泽字节。据知名调研机构IDC公司估计,今年全球存储的数据总量预计将达到2.7泽字节,比2011年增长48%。所以,我们离达到尧字节这个大关还有很长一段路,不过从目前大数据的增长速度来看,那一天的到来可能比我们想象的要快。
顺便说一下,1泽字节相当于1021字节的数据。它相当于1000艾字节(EB)、100万拍字节(PB)和10亿太字节(TB)。
ZooKeeper
ZooKeeper是由Apache软件基金会创建的一项服务,旨在帮助Hadoop用户管理和协调跨分布式网络的Hadoop节点。
ZooKeeper与HBase紧密集成,而HBase是与Hadoop有关的数据库。ZooKeeper是一项集中式服务,用于维护配置信息、命名服务、分布式同步及其他群组服务。IT管理人员用它来实现可靠的消息传递机制、同步流程执行及实施冗余服务。
我简单说一下条形码条形码的概念条形码或条码(barcode)是将宽度不等的多个黑条和空白,按照一定的编码规则排列,用以表达一组信息的图形标识符。常见的条形码是由反射率相差很大的黑条(简称条)和白条(简称空)排成的平行线图案。条形码可以标出物品的生产国、制造厂家、商品名称、生产日期、图书分类号、邮件起止地点、类别、日期等许多信息,因而在商品流通、图书管理、邮政管理、银行系统等许多领域都得到了广泛的应用。[一、条形码的历史条形码技术最早产生在风声鹤唳的二十世纪二十年代,诞生于威斯汀豪斯(Westinghouse)的实验室里。一位名叫约翰·科芒德(JohnKermode)性格古怪的发明家“异想天开”地想对邮政单据实现自动分检,那时候对电子技术应用方面的每一个设想都使人感到非常新奇。他的想法是在信封上做条码标记,条码中的信息是收信人的地址,就象今天的邮政编码。为此科芒德发明了最早的条码标识,设计方案非常的简单(注:这种方法称为模块比较法),即一个“条”表示数字“1”,二个“条”表示数字“2”,以次类推。然后,他又发明了由基本的元件组成的条码识读设备:一个扫描器(能够发射光并接收反射光);一个测定反射信号条和空的方法,即边缘定位线圈;和使用测定结果的方法,即译码器。科芒德的扫描器利用当时新发明的光电池来收集反射光。“空”反射回来的是强信号,“条”反射回来的是弱信号。与当今高速度的电子元器件应用不同的是,科芒德利用磁性线圈来测定“条”和“空”。就象一个小孩将电线与电池连接再绕在一颗钉子上来夹纸。科芒德用一个带铁芯的线圈在接收到“空”的信号的时候吸引一个开关,在接收到“条”的信号的时候,释放开关并接通电路。因此,最早的条码阅读器噪音很大。开关由一系列的继电器控制,“开”和“关”由打印在信封上“条”的数量决定。通过这种方法,条码符号直接对信件进行分检。此后不久,科芒德的合作者道格拉斯·杨(DouglasYoung),在科芒德码的基础上作了些改进。科芒德码所包含的信息量相当的低,并且很难编出十个以上的不同代码。而杨码使用更少的条,但是利用条之间空的尺寸变化,就象今天的UPC条码符号使用四个不同的条空尺寸。新的条码符号可在同样大小的空间对一百个不同的地区进行编码,而科芒德码只能对十个不同的地区进行编码。直到1949年的专利文献中才第一次有了诺姆·伍德兰(NormWoodland)和伯纳德·西尔沃(BernardSilver)发明的全方位条形码符号的记载,在这之前的专利文献中始终没有条形码技术的记录,也没有投入实际应用的先例。诺姆·伍德兰和伯纳德·西尔沃的想法是利用科芒德和杨的垂直的“条”和“空”,并使之弯曲成环状,非常象射箭的靶子。这样扫描器通过扫描图形的中心,能够对条形码符号解码,不管条形码符号方向的朝向。在利用这项专利技术对其进行不断改进的过程中,一位科幻小说作家艾萨克·阿西莫夫(IsaacAzimov)在他的《赤裸的太阳》(TheNakedSun)一书中讲述了使用信息编码的新方法实现自动识别的事例。那时人们觉得此书中的条形码符号看上去象是一个方格子的棋盘,但是今天的条形码专业人士马上会意识到这是一个二维矩阵条形码符号。虽然此条形码符号没有方向、定位和定时,但很显然它表示的是高信息密度的数字编码。直到1970年IterfaceMechanisms公司开发出“二维码”之后,才有了价格适于销售的二维矩阵条码的打印和识读设备。那时二维矩阵条形码用于报社排版过程的自动化。二维矩阵条形码印在纸带上,由今天的一维CCD扫描器扫描识读。CCD发出的光照在纸带上,每个光电池对准纸带的不同区域。每个光电池根据纸带上印刷条码与否输出不同的图案,组合产生一个高密度信息图案。用这种方法可在相同大小的空间打印上一个单一的字符,作为早期科芒德码之中的一个单一的条。定时信息也包括在内,所以整个过程是合理的。当第一个系统进入市场后,包括打印和识读设备在内的全套设备大约要5000美元。此后不久,随着LED(发光二极管)、微处理器和激光二极管的不断发展,迎来了新的标识符号(象征学)和其应用的大爆炸,人们称之为“条码工业”。今天很少能找到没有直接接触过即快又准的条形码技术的公司或个人。由于在这一领域的技术进步与发展非常迅速,并且每天都有越来越多的应用领域被开发,用不了多久条形码就会像灯泡和半导体收音机一样普及,将会使我们每一个人的生活都变得更加轻松和方便。[编辑本段]二、条形码的识别原理要将按照一定规则编译出来的条形码转换成有意义的信息,需要经历扫描和译码两个过程。物体的颜色是由其反射光的类型决定的,白色物体能反射各种波长的可见光,黑色物体则吸收各种波长的可见光,所以当条形码扫描器光源发出的光在条形码上反射后,反射光照射到条码扫描器内部的光电转换器上,光电转换器根据强弱不同的反射光信号,转换成相应的电信号。根据原理的差异,扫描器可以分为光笔、CCD、激光三种。电信号输出到条码扫描器的放大电路增强信号之后,再送到整形电路将模拟信号转换成数字信号。白条、黑条的宽度不同,相应的电信号持续时间长短也不同。然后译码器通过测量脉冲数字电信号0,1的数目来判别条和空的数目。通过测量0,1信号持续的时间来判别条和空的宽度。此时所得到的数据仍然是杂乱无章的,要知道条形码所包含的信息,则需根据对应的编码规则(例如:EAN-8码),将条形符号换成相应的数字、字符信息。最后,由计算机系统进行数据处理与管理,物品的详细信息便被识别了。[编辑本段]三、条形码的优越性1.可靠性强。条形码的读取准确率远远超过人工记录,平均每15000个字符才会出现一个错误。2.效率高。条形码的读取速度很快,相当于每秒40个字符。3.成本低。与其它自动化识别技术相比较,条形码技术仅仅需要一小张贴纸和相对构造简单的光学扫描仪,成本相当低廉。4.易于制作。条形码的编写很简单,制作也仅仅需要印刷,被称作为“可印刷的计算机语言”。5.易于 *** 作。条形码识别设备的构造简单,使用方便。6.灵活实用。条形码符号可以手工键盘输入,也可以和有关设备组成识别系统实现自动化识别,还可和其他控制设备联系起来实现整个系统的自动化管理。[编辑本段]四、条形码的扫描条形码的扫描需要扫描器,扫描器利用自身光源照射条形码,再利用光电转换器接受反射的光线,将反射光线的明暗转换成数字信号。不论是采取何种规则印制的条形码,都由静区、起始字符、数据字符与终止字符组成。有些条码在数据字符与终止字符之间还有校验字符。▲静区:顾名思义,不携带任何信息的区域,起提示作用。▲起始字符:第一位字符,具有特殊结构,当扫描器读取到该字符时,便开始正式读取代码了。▲数据字符:条形码的主要内容。▲校验字符:检验读取到的数据是否正确。不同编码规则可能会有不同的校验规则。▲终止字符:最后一位字符,一样具有特殊结构,用于告知代码扫描完毕,同时还起到只是进行校验计算的作用。为了方便双向扫描,起止字符具有不对称结构。因此扫描器扫描时可以自动对条码信息重新排列。条码扫描器有光笔、CCD、激光三种▲光笔:最原始的扫描方式,需要手动移动光笔,并且还要与条形码接触。▲CCD:以CCD作为光电转换器,LED作为发光光源的扫描器。在一定范围内,可以实现自动扫描。并且可以阅读各种材料、不平表面上的条码,成本也较为低廉。但是与激光式相比,扫描距离较短。▲激光:以激光作为发光源的扫描器。又可分为线型、全角度等几种。线型:多用于手持式扫描器,范围远,准确性高。全角度:多为卧式,自动化程度高,在各种方向上都可以自动读取条码。[编辑本段]五、条形码技术的优点条形码是迄今为止最经济、实用的一种自动识别技术。条形码技术具有以下几个方面的优点A.输入速度快:与键盘输入相比,条形码输入的速度是键盘输入的5倍,并且能实现“即时数据输入”。B.可靠性高:键盘输入数据出错率为三百分之一,利用光学字符识别技术出错率为万分之一,而采用条形码技术误码率低于百万分之一。C.采集信息量大:利用传统的一维条形码一次可采集几十位字符的信息,二维条形码更可以携带数千个字符的信息,并有一定的自动纠错能力。D.灵活实用:条形码标识既可以作为一种识别手段单独使用,也可以和有关识别设备组成一个系统实现自动化识别,还可以和其他控制设备联接起来实现自动化管理。另外,条形码标签易于制作,对设备和材料没有特殊要求,识别设备 *** 作容易,不需要特殊培训,且设备也相对便宜。[编辑本段]六、条形码的编码规则唯一性:同种规格同种产品对应同一个产品代码,同种产品不同规格应对应不同的产品代码。根据产品的不同性质,如:重量、包装、规格、气味、颜色、形状等等,赋予不同的商品代码。永久性:产品代码一经分配,就不再更改,并且是终身的。当此种产品不再生产时,其对应的产品代码只能搁置起来,不得重复起用再分配给其它的商品。无含义:为了保证代码有足够的容量以适应产品频繁的更新换代的需要,最好采用无含义的顺序码。条形码校验码公式:1、首先,把条形码从右往左依次编序号为“……4,3,2,1。”从序号二开始把所有偶数序号位上的数相加求和,用求出的和乘3,再从序号三开始把所有奇数序号上的数相加求和,用求出的和加上刚才偶数序号上的数的和乘3的积,然后得出和。再用大于这个和的最小的10的倍数减去这个和,就得出校验码。举个例子:此条形码为:977167121601X(X为校验码)。1、1+6+2+7+1+7=242、24×3=723、0+1+1+6+7+9=244、72+24=965、100-96=4所以最后校验码X=4。此条形码为9771671216014。[编辑本段]七、条形码的码制区别UPC:(统一产品代码)只能表示数字有A、B、C、D、E四个版本版本A-12位数字版本E-7位数字最后一位为校验位大小是宽1.5"高1",而且背景要与清晰主要使用于美国和加拿大地区,用于工业、医药、仓库等部门。当UPC作为十二位进行解码时,定义如下:第一位=数字标识(已经由UCC(统一代码委员会)所建立).第2-6位=生产厂家的标识号(包括第一位)第7-11=唯一的厂家产品代码第12位=校验位(usedforerrordetection)Code3of9:能表示字母、数字和其它一些符号共43个字符:A-Z,0-9,-.$/+%,pace条形码的长度是可变化的,通常用“*”号作为起始、终止符校验码不用代码密度介于3-9.4个字符/每英寸,空白区是窄条的10倍,用于工业、图书、以及票证自动化管理上。Code128:表示高密度数据,字符串可变长,符号内含校验码,有三种不同版本:A,B,andC可用128个字符分别在A,B,orC三个字符串集合中,用于工业、仓库、零售批发。Interleaved2-of-5(I2of5):只能表示数字0-9可变长度,连续性条形码,所有条与空都表示代码,第一个数字由条开始,第二个数字由空组成空白区比窄条宽10倍,应用于商品批发、仓库、机场、生产/包装识别、工业中,条形码的识读率高,可适用于固定扫描器可靠扫描,在所有一维条形码中的密度最高。Codabar(库德巴码):可表示数字0-9,字符$、+、-、还有只能用作起始/终止符的a,b,cd四个字符,可变长度,没有校验位,应用于物料管理、图书馆、血站和当前的机场包裹发送中,空白区比窄条宽10,非连续性条形码,每个字符表示为4条3空。Codabar又名NW7,NW7是在日本的叫法。PDF417(二维码):多行组成的条形码,不需要连接一个数据库,本身可存储大量数据,应用于:医院、驾驶证、物料管理、货物运输,当条形码受一定破坏时,错误纠正能使条形码能正确解码PDF417,是讯博尔(Symbol)科技公司于1990年研制的产品。它是一个多行、连续性、可变长、包含大量数据的符号标识。每个条形码有3-90行,每一行有一个起始部分、数据部分、终止部分。它的字符集包括所有128个字符,最大数据含量是1850个字符。一维条形码只是在一个方向(一般是水平方向)表达信息,而在垂直方向则不表达任何信息,其一定的高度通常是为了便于阅读器的对准。一维条形码的应用可以提高信息录入的速度,减少差错率,但是一维条形码也存在一些不足之处:*数据容量较小:30个字符左右*只能包含字母和数字*条形码尺寸相对较大(空间利用率较低)*条形码遭到损坏后便不能阅读在水平和垂直方向的二维空间存储信息的条形码,称为二维条形码(2-dimensionalbarcode)。与一维条形码一样,二维条形码也有许多不同的编码方法,或称码制。就这些码制的编码原理而言,通常可分为以下三种类型1.线性堆叠式二维码是在一维条形码编码原理的基础上,将多个一维码在纵向堆叠而产生的。典型的码制如:Code16K、Code49、PDF417等。2.矩阵式二维码是在一个矩形空间通过黑、白像素在矩阵中的不同分布进行编码。典型的码制如:Aztec、MaxiCode、QRCode、DataMatrix等。3.邮政码通过不同长度的条进行编码,主要用于邮件编码,如:Postnet、BPO4-State。在许多种类的二维条形码中,常用的码制有:DataMatrix,MaxiCode,Aztec,QRCode,Vericode,PDF417,Ultracode,Code49,Code16K等,其中:*DataMatrix主要用于电子行业小零件的标识,如英特尔(Intel)的奔腾处理器的背面就印制了这种码。*MaxiCode是由美国联合包裹服务(UPS)公司研制的,用于包裹的分拣和跟踪。*Aztec是由美国韦林(WelchAllyn)公司推出的,最多可容纳3832个数字或3067个字母字符或1914个字节的数据。下面,我们以PDF417码为例,介绍二维条形码的特性和特点。一)PDF417简介PDF417码是由留美华人王寅敬(音)博士发明的。PDF是取英文PortableDataFile三个单词的首字母的缩写,意为“便携数据文件”。因为组成条形码的每一符号字符都是由4个条和4个空构成,如果将组成条形码的最窄条或空称为一个模块,则上述的4个条和4个空的总模块数一定为17,所以称417码或PDF417码。二)PDF417的特点1.信息容量大PDF417码除可以表示字母、数字、ASCII字符外,还能表达二进制数。为了使得编码更加紧凑,提高信息密度,PDF417在编码时有三种格式:*扩展的字母数字压缩格式可容纳1850个字符;*二进制/ASCII格式可容纳1108个字节;*数字压缩格式可容纳2710个数字。2.错误纠正能力一维条形码通常具有校验功能以防止错读,一旦条形码发生污损将被拒读。而二维条形码不仅能防止错误,而且能纠正错误,即使条形码部分损坏,也能将正确的信息还原出来。3.印制要求不高普通打印设备均可打印,传真件也能阅读。4.可用多种阅读设备阅读PDF417码可用带光栅的激光阅读器,线性及面扫描的图像式阅读器阅读。5.尺寸可调以适应不同的打印空间6.码制公开已形成国际标准,我国也已制定了417码的国标。三)PDF417的纠错功能二维条形码的纠错功能是通过将部分信息重复表示(冗余)来实现的。比如在PDF417码中,某一行除了包含本行的信息外,还有一些反映其它位置上的字符(错误纠正码)的信息。这样,即使当条形码的某部分遭到损坏,也可以通过存在于其它位置的错误纠正码将其信息还原出来。PDF417的纠错能力依错误纠正码字数的不同分为0~8共9级,见图4,级别越高,纠正码字数越多,纠正能力越强,条形码也越大。当纠正等级为8时,即使条形码污损50%也能被正确读出。四)PDF417的几种变形PDF417还有几种变形的码制形式:*PDF417截短码在相对“干净”的环境中,条形码损坏的可能性很小,则可将右边的行指示符省略并减少终止符。*PDF417微码进一步缩减的PDF码。*宏PDF417码当文件内容太长,无法用一个PDF417码表示时,可用包含多个(1~99999个)条形码分块的宏PDF417码来表示。二维条形码的优势从以上的介绍可以看出,与一维条形码相比二维条形码有着明显的优势,归纳起来主要有以下几个方面:一)数据容量更大二)超越了字母数字的限制三)条形码相对尺寸小四)具有抗损毁能力[编辑本段]八、条形码的制作条形码的制作一般用印刷或通过条码打印机打印条形码。条码打印机和普通打印机的最大的区别就是,条码打印机的打印是以热为基础,以碳带为打印介质(或直接使用热敏纸)完成打印,配合不同材质的碳带可以实现高质量的打印效果和在无人看管的情况下实现连续高速打印。一、应用软件LabelmxCorelDRAWPhotoshopIllustratorLabelmx属于专业条形码生成与打印软件,集条码生成、画图设计、标签制作、批量打印于一体,可打印固定与可变数据,CorelDRAW、Photoshop、Illustrator属于专业的画图设计软件,另外Labelmx可以导出条码为矢量图片(.emf和.wmf)和CorelDRAW、Photoshop、Illustrator交互使用。[编辑本段]九、商品条码:EAN-13通用商品条形码一般由前缀部分、制造厂商代码、商品代码和校验码组成。商品条形码中的前缀码是用来标识国家或地区的代码,赋码权在国际物品编码协会,如00-09代表美国、加拿大。45-49代表日本。690-692代表中国大陆,471代表我国台湾地区,489代表香港特区。制造厂商代码的赋权在各个国家或地区的物品编码组织,我国由国家物品编码中心赋予制造厂商代码。商品代码是用来标识商品的代码,赋码权由产品生产企业自己行使,生产企业按照规定条件自己决定在自己的何种商品上使用哪些阿拉伯数字为商品条形码。商品条形码最后用1位校验码来校验商品条形码中左起第l-12数字代码的正确性。商品条形码是指由一组规则排列的条、空及其对应字符组成的标识,用以表示一定的商品信息的符号。其中条为深色、空为纳色,用于条形码识读设备的扫描识读。其对应字符由一组阿拉伯数字组成,供人们直接识读或通过键盘向计算机输入数据使用。这一组条空和相应的字符所表示的信息是相同的。条形码技术是随着计算机与信息技术的发展和应用而诞生的,它是集编码、印刷、识别、数据采集和处理于一身的新型技术。使用条形码扫描是今后市场流通的大趋势。为了使商品能够在全世界自由、广泛地流通,企业无论是设计制作,申请注册还是使用商品条形码,都必须遵循商品条形码管理的有关规定。目前世界上常用的码制有ENA条形码、UPC条形码、二五条形码、交叉二五条形码、库德巴条形码、三九条形码和128条形码等,而商品上最常使用的就是EAN商品条形码。EAN商品条形码亦称通用商品条形码,由国际物品编码协会制定,通用于世界各地,是目前国际上使用最广泛的一种商品条形码。我国目前在国内推行使用的也是这种商品条形码。EAN商品条形码分为EAN-13(标准版)和EAN-8(缩短版)两种。商品条形码的编码遵循唯一性原则,以保证商品条形码在全世界范围内不重复,即一个商品项目只能有一个代码,或者说一个代码只能标识一种商品项目。不同规格、不同包装、不同品种、不同价格、不同颜色的商品只能使用不同的商品代码。商品条形码的标准尺寸是37.29mmx26.26mm,放大倍率是0.8-2.0。当印刷面积允许时,应选择1.0倍率以上的条形码,以满足识读要求。放大倍数越小的条形码,印刷精度要求越高,当印刷精度不能满足要求时,易造成条形码识读困难。由于条形码的识读是通过条形码的条和空的颜色对比度来实现的,一般情况下,只要能够满足对比度(PCS值)的要求的颜色即可使用。通常采用浅色作空的颜色,如白色、橙色、黄色等,采用深色作条的颜色,如黑色、暗绿色、深棕色等。最好的颜色搭配是黑条白空。根据条形码检测的实践经验,红色、金色、浅黄色不宜作条的颜色,透明、金色不能作空的颜色。EAN-8商品条形码是指用于标识的数字代码为8位的商品条形码,由7位数字表示的商品项目代码和1位数字表示的校验符组成。商品条形码的诞生极大地方便了商品流通,现代社会已离不开商品条形码。据统计,目前我国已有50万种产品使用了国际通用的商品条形码。我国加入世贸组织后,企业在国际舞台上必将赢得的活动空间。要与国际惯例接轨,适应国际经贸的需要,企业更不能慢待商品条形码。前缀码编码组织所在国家(或地区)/应用领域前缀码编码组织所在国家(或地区)/应用领域000~019;030~039;060~139美国020~029;040~049;200~299店内码050~059优惠券300~379法国380保加利亚383斯洛文尼亚385克罗地亚387波黑400~440德国450~459490~499日本460~469俄罗斯470吉尔吉斯斯坦471中国台湾474爱沙尼亚475拉脱维亚476阿塞拜疆477立陶宛478乌兹别克斯坦479斯里兰卡480菲律宾481白俄罗斯482乌克兰484摩尔多瓦485亚美尼亚486格鲁吉亚487哈萨克斯坦489中国香港特别行政区500~509英国520希腊528黎巴嫩529塞浦路斯530阿尔巴尼亚531马其顿535马耳他539爱尔兰540~549比利时和卢森堡560葡萄牙569冰岛570~579丹麦590波兰594罗马尼亚599匈牙利600、601南非603加纳608巴林609毛里求斯611摩洛哥613阿尔及利亚616肯尼亚618象牙海岸619突尼斯621叙利亚622埃及624利比亚625约旦626伊朗627科威特628沙特阿拉伯629阿拉伯联合酋长国640~649芬兰690~695中华人民共和国700~709挪威729以色列730~739瑞典740危地马拉741萨尔瓦多742洪都拉斯743尼加拉瓜744哥斯达黎加745巴拿马746多米尼加750墨西哥754~755加拿大759委内瑞拉760~769瑞士770哥伦比亚773乌拉圭775秘鲁777玻利维亚779阿根廷780智利784巴拉圭786厄瓜多尔789~790巴西800~839意大利840~849西班牙850古巴858斯洛伐克859捷克860南斯拉夫865蒙古867朝鲜869土耳其870~879荷兰880韩国884柬埔寨885泰国888新加坡890印度893越南899印度尼西亚900~919奥地利930~939澳大利亚940~949新西兰955马来西亚958中国澳门特别行政区977连续出版物978、979图书980应收票据981、982普通流通券990~999优惠券[编辑本段]十、印刷制作条形码的要求商品条形码的标准尺寸是37.29mmx26.26mm,放大倍率是0.8-2.0。当印刷面积允许时,应选择1.0倍率以上的条形码,以满足识读要求。放大倍数越小的条形码,印刷精度要求越高,当印刷精度不能满足要求时,易造成条形码识读困难。由于条形码的识读是通过条形码的条和空的颜色对比度来实现的,一般情况下,只要能够满足对比度(PCS值)的要求的颜色即可使用。通常采用浅色作空的颜色,如白色、橙色、黄色等,采用深色作条的颜色,如黑色、暗绿色、深棕色等。最好的颜色搭配是黑条白空。根据条形码检测的实践经验,红色、金色、浅黄色不宜作条的颜色,透明、金色不能作空的颜色。十一、商品条码数字的含义以条形码6936983800013为例此条形码分为4个部分,从左到右分别为:1-3位:共3位,对应该条码的693,是中国的国家代码之一。(690--695都是中国的代码,由国际上分配);4-8位:共5位,对应该条码的69838,代表着生产厂商代码,由厂商申请,国家分配;9-12位:共4位,对应该条码的0001,代表着厂内商品代码,由厂商自行确定;第13位:共1位,对应该条码的3,是校验码,依据一定的算法,由前面12位数字计算而得到。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)