简单理解:物物相连的互联网,即物联网。物联网在国际上又称为传感网,这是继计算机、互联网与移动通信网之后的又一次信息产业浪潮。世界上的万事万物,小到手表、钥匙,大到汽车、楼房,只要嵌入一个微型感应芯片,把它变得智能化,这个物体就可以“自动开口说话”。再借助无线网络技术,人们就可以和物体“对话”,物体和物体之间也能“交流”,这就是物联网。随着信息技术的发展,物联网行业应用版图不断增长。如:智能交通、环境保护、政府工作、公共安全、平安家居、智能消防、工业监测、老人护理、个人健康、花卉栽培、水系监测、食品溯源等。大的理想就是智慧地球,目前实际生活中存在并在建设的智慧城市都是物联网炒的概念。
2、大数据
大数据(big data),就是指种类多、流量大、容量大、价值高、处理和分析速度快的真实数据汇聚的产物。大数据或称巨量资料或海量数据资源,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
大数据的4V特点:Volume、Velocity、Variety、Veracity。
即:数量Volume、多样性Variety、速度Velocity、和真实性Veracity。
(1)物联网中的数据量更大:物联网的最主要特征之一是节点的海量性,除了人和服务器之外,物品、设备、传感网等都是物联网的组成节点,其数量规模远大于互联网;同时,物联网节点的数据生成频率远高于互联网,如传感节点多数处于全时工作状态,数据流源源不断。
(2)物联网中的数据速率更高:一方面,物联网中数据海量性必然要求骨干网汇聚更多的数据,数据的传输速率要求更高;另一方面,由于物联网与真实物理世界直接关联,很多情况下需要实时访问、控制相应的节点和设备,因此需要高数据传输速率来支持相应的实时性。
(3)物联网中的数据更加多样化:物联网涉及的应用范围广泛,从智慧城市、智慧交通、智慧物流、商品溯源,到智能家居、智慧医疗、安防监控等,无一不是物联网应用范畴;在不同领域、不同行业,需要面对不同类型、不同格式的应用数据,因此物联网中数据多样性更为突出。
(4)物联网对数据真实性的要求更高:物联网是真实物理世界与虚拟信息世界的结合,其对数据的处理以及基于此进行的决策将直接影响物理世界,物联网中数据的真实性显得尤为重要。
随着计算机技术、信息技术、网络技术的迅速发展(主要是云计算和现代网络技术的发展),世界各地、各行业、各单位每天都产生包括数字、文字、视频、音频等在内的海量信息,这些海量信息统称为大数据。在大数据的海洋中,利用“沙里淘金”的技术把有用数据提炼分拣出来,是大数据应用的重要内容之一。大数据应用技术大致可分为以下步骤:数据库的搜集和挖掘,数据质量的甄别和校正,信息的处理(数学模型的建立和校正),大数据的分析与成果的形成。自2013年大数据概念兴起至今,运用物联网端设施对数据库的搜集技术已经成熟,并且大数据是最先在气象中使用的,通过大型计算机的运算以及过去60年的气象数据,建立识别天气的模型,然后将这些模型与当前的气候条件进行比较,再运用预测性分析进行天气预报。
在万物互联的时代,气象大数据在大规模的收集与应用,气象数据是最用以与平衡领域产生交集和应用的大数据,例如旅游、农业、大健康等等。
以气象大数据和农业的应用为例,气象物联网大数据在农业领域的应用推动农业向“精准”和“智慧”方向发展。
1农场气象实时监测,极端气象及时预报
实时监测空气温湿度、光照、降雨量、风速、风向、大气压力、气体浓度等数据,并通过设定相关报警阈值,实现即时报警,精准控制种植环境指标。
根据卫星数据,系统可预报未来72小时气象,24小时极端天气、降水概率、大风等异常气象预警,提醒用户及时做好防灾防险准备。
2土壤墒情精准监测,异常情况快速预警
实时监测土壤水张力、土壤温湿度、水位、溶氧量、pH值等。
通过设定报警阈值,当土壤数据异常时,如湿度过高,系统自动发出预警消息提醒工作人员。
3远程掌握田间虫情,无公害诱捕杀虫
系统可实现害虫类别自动分类及计数,并自动进行无公害诱捕杀虫,减少农药的使用
通过高清摄像机采集虫情图像,可远程查看田间虫情,并制定防治措施。
4作物长势监测,突发情况可自动转向紧急录像
高清摄像头可720度旋转、拉近、拉远,查看园区实时生产情况;
发生预警时,摄像头可自动转向到预警点紧急录像,不放过任何异常;
可对视频进行截图,无需另外安装相机进行拍摄。
1高效分布式必须是高效的分布式系统。物联网产生的数据量巨大,仅中国而言,就有5亿多台智能电表,每台电表每隔15分钟采集一次数据,一天全国智能电表就会产生500多亿条记录。这么大的数据量,任何一台服务器都无能力处理,因此处理系统必须是分布式的,水平扩展的。为降低成本,一个节点的处理性能必须是高效的,需要支持数据的快速写入和快速查询。
2实时处理
必须是实时处理的系统。互联网大数据处理,大家所熟悉的场景是用户画像、推荐系统、舆情分析等等,这些场景并不需要什么实时性,批处理即可。但是对于物联网场景,需要基于采集的数据做实时预警、决策,延时要控制在秒级以内。如果计算没有实时性,物联网的商业价值就大打折扣。
3高可靠性
需要运营商级别的高可靠服务。物联网系统对接的往往是生产、经营系统,如果数据处理系统宕机,直接导致停产,产生经济有损失、导致对终端消费者的服务无法正常提供。比如智能电表,如果系统出问题,直接导致的是千家万户无法正常用电。因此物联网大数据系统必须是高可靠的,必须支持数据实时备份,必须支持异地容灾,必须支持软件、硬件在线升级,必须支持在线IDC机房迁移,否则服务一定有被中断的可能。
4高效缓存
需要高效的缓存功能。绝大部分场景,都需要能快速获取设备当前状态或其他信息,用以报警、大屏展示或其他。系统需要提供一高效机制,让用户可以获取全部、或符合过滤条件的部分设备的最新状态。
5实时流式计算
需要实时流式计算。各种实时预警或预测已经不是简单的基于某一个阈值进行,而是需要通过将一个或多个设备产生的数据流进行实时聚合计算,不只是基于一个时间点、而是基于一个时间窗口进行计算。不仅如此,计算的需求也相当复杂,因场景而异,应容许用户自定义函数进行计算。
6数据订阅
需要支持数据订阅。与通用大数据平台比较一致,同一组数据往往有很多应用都需要,因此系统应该提供订阅功能,只要有新的数据更新,就应该实时提醒应用。而且这个订阅也应该是个性化的,容许应用设置过滤条件,比如只订阅某个物理量五分钟的平均值。
7和历史数据处理合二为一
实时数据和历史数据的处理要合二为一。实时数据在缓存里,历史数据在持久化存储介质里,而且可能依据时长,保留在不同存储介质里。系统应该隐藏背后的存储,给用户和应用呈现的是同一个接口和界面。无论是访问新采集的数据还是十年前的老数据,除输入的时间参数不同之外,其余应该是一样的。
8数据持续稳定写入
需要保证数据能持续稳定写入。对于物联网系统,数据流量往往是平稳的,因此数据写入所需要的资源往往是可以估算的。但是变化的是查询、分析,特别是即席查询,有可能耗费很大的系统资源,不可控。因此系统必须保证分配足够的资源以确保数据能够写入系统而不被丢失。准确的说,系统必须是一个写优先系统。
9数据多维度分析
需要对数据支持灵活的多维度分析。对于联网设备产生的数据,需要进行各种维度的统计分析,比如从设备所处的地域进行分析,从设备的型号、供应商进行分析,从设备所使用的人员进行分析等等。而且这些维度的分析是无法事先想好的,而是在实际运营过程中,根据业务发展的需求定下来的。因此物联网大数据系统需要一个灵活的机制增加某个维度的分析。
10支持数据计算
需要支持数据降频、插值、特殊函数计算等 *** 作。原始数据的采集可能频次挺高,但具体分析时,往往不需要对原始收据进行,而是数据降频之后。系统需要提供高效的数据降频 *** 作。设备是很难同步的,不同设备采集数据的时间点是很难对齐的,因此分析一个特定时间点的值,往往需要插值才能解决,系统需要提供线性插值、设置固定值等多种插值策略才行。工业互联网里,除通用的统计 *** 作之外,往往还需要支持一些特殊函数,比如时间加权平均。
11即席分析和查询
需要支持即席分析和查询。为提高大数据分析师的工作效率,系统应该提供一命令行工具或容许用户通过其他工具,执行SQL查询,而不是非要通过编程接口。查询分析的结果可以很方便的导出,再制作成各种图标。
12灵活数据管理策略
需要提供灵活的数据管理策略。一个大的系统,采集的数据种类繁多,而且除采集的原始数据外,还有大量的衍生数据。这些数据各自有不同的特点,有的采集频次高,有的要求保留时间长,有的需要多个副本以保证更高的安全性,有的需要能快速访问。因此物联网大数据平台必须提供多种策略,让用户可以根据特点进行选择和配置,而且各种策略并存。
13开放的系统
必须是开放的。系统需要支持业界流行的标准SQL,提供各种语言开发接口,包括C/C++,Java,Go,Python,RESTful等等,也需要支持Spark,R,Matlab等等,方便集成各种机器学习、人工智能算法或其他应用,让大数据处理平台能够不断扩展,而不是成为一个孤岛。
14支持异构环境
系统必须支持异构环境。大数据平台的搭建是一个长期的工作,每个批次采购的服务器和存储设备都会不一样,系统必须支持各种档次、各种不同配置的服务器和存储设备并存。
15支持边云协同
需要支持边云协同。要有一套灵活的机制将边缘计算节点的数据上传到云端,根据具体需要,可以将原始数据,或加工计算后的数据,或仅仅符合过滤条件的数据同步到云端,而且随时可以取消,更改策略。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)