大数据的获取特点有哪些,其4v特征分别是什么

大数据的获取特点有哪些,其4v特征分别是什么,第1张

数据的特点:
海量性、多样性、高速性、易变性。
详细来说:
1、容量(Volume):数据的大小决定所考虑的数据的价值的和潜在的信息;
2、种类(Variety):数据类型的多样性;
3、速度(Velocity):指获得数据的速度;
4、可变性(Variability):妨碍了处理和有效地管理数据的过程。
5、真实性(Veracity):数据的质量
6、复杂性(Complexity):数据量巨大,来源多渠道
大数据三大特征
第一个特征是数据类型繁多。包括网络日志、音频、视频、、地理位置信息等等多类型的数据对数据的处理能力提出了更高的要求 。
第二个特征是数据价值密度相对较低。如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。
第三个特征是处理速度快、时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。
大数据的意义:
现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。
有人把数据比喻为蕴藏能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。对于很多行业而言,如何利用这些大规模数据是成为赢得竞争的关键。
大数据的缺陷:
不过,“大数据”在经济发展中的巨大意义并不代表其能取代一切对于社会问题的理性思考,科学发展的逻辑不能被湮没在海量数据中。著名经济学家路德维希·冯·米塞斯曾提醒过:“就今日言,有很多人忙碌于资料之无益累积,以致对问题之说明与解决,丧失了其对特殊的经济意义的了解。” 这确实是需要警惕的。
其4v特征分别是:
Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。

1 高效分布式


有必要是高效的分布式体系。物联网发生的数据量巨大,仅我国而言,就有5亿多台智能电表,每台电表每隔15分钟采集一次数据,一天全国智能电表就会发生500多亿条记载。这么大的数据量,任何一台服务器都无能力处理,因而处理体系有必要是分布式的,水平扩展的。


2 实时处理


有必要是实时处理的体系。互联网大数据处理,大家所了解的场景是用户画像、推荐体系、舆情分析等等,这些场景并不需求什么实时性,批处理即可。可是关于物联网场景,需求根据采集的数据做实时预警、决议计划,延时要控制在秒级以内。


3 高牢靠性


需求运营商等级的高牢靠服务。物联网体系对接的往往是生产、经营体系,假如数据处理体系宕机,直接导致停产,发生经济有丢失、导致对终端顾客的服务无法正常供给。比方智能电表,假如体系出问题,直接导致的是千家万户无法正常用电。


4 高效缓存


需求高效的缓存功用。绝大部分场景,都需求能快速获取设备当前状态或其他信息,用以报警、大屏展示或其他。体系需求供给一高效机制,让用户能够获取全部、或契合过滤条件的部分设备的最新状态。


5 实时流式核算


需求实时流式核算。各种实时预警或猜测现已不是简单的根据某一个阈值进行,而是需求经过将一个或多个设备发生的数据流进行实时聚合核算,不只是根据一个时间点、而是根据一个时间窗口进行核算。不仅如此,核算的需求也适当杂乱,因场景而异,应容许用户自定义函数进行核算。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/dianzi/10899680.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-12
下一篇 2023-05-12

发表评论

登录后才能评论

评论列表(0条)

保存