大数据可以应用在哪些方面

大数据可以应用在哪些方面,第1张

可以应用在云计算方面。

数据具体的应用:

1、洛杉矶警察局和加利福尼亚大学合作利用大数据预测犯罪的发生。

2、google流感趋势(Google Flu Trends)利用搜索关键词预测禽流感的散布。

3、统计学家内特西尔弗(Nate Silver)利用大数据预测2012美国选举结果。

4、麻省理工学院利用手机定位数据和交通数据建立城市规划。

5、梅西百货的实时定价机制。根据需求和库存的情况,该公司基于SAS的系统对多达7300万种货品进行实时调价。

6、医疗行业早就遇到了海量数据和非结构化数据的挑战,而近年来很多国家都在积极推进医疗信息化发展,这使得很多医疗机构有资金来做大数据分析。

7、及时解析故障、问题和缺陷的根源,每年可能为企业节省数十亿美元。

8、为成千上万的快递车辆规划实时交通路线,躲避拥堵。

9、分析所有SKU,以利润最大化为目标来定价和清理库存。

10、根据客户的购买习惯,为其推送他可能感兴趣的优惠信息。

扩展资料:

大数据的用处:

1、与云计算的深度结合。大数据离不开云处理,云处理为大数据提供了d性可拓展的基础设备,是产生大数据的平台之一。

自2013年开始,大数据技术已开始和云计算技术紧密结合,预计未来两者关系将更为密切。除此之外,物联网、移动互联网等新兴计算形态,也将一齐助力大数据革命,让大数据营销发挥出更大的影响力。

2、科学理论的突破。随着大数据的快速发展,就像计算机和互联网一样,大数据很有可能是新一轮的技术革命。可能会改变数据世界里的很多算法和基础理论,实现科学技术上的突破。

参考资料:


百度百科--大数据

第一阶段linux+搜索+hadoop体系
Linux基础→shell编程→高并发架构→hadoop体系→HDFS→mapreduce→hbase→zookeeper→hive→lucene搜索→solr/solrcloud→elasticsearch分布式搜索→CM+CDH集群管理→impala→oozie→flume→sqoop
第二阶段机器学习
R语言→mahout
第三阶段storm流式计算
kafka→storm→redis
第四阶段spark内存计算
scala编程→spark core→spark sql→spark streaming→spark mllib→spark graphx→项目实战四→python机器学习→spark python编程
第五阶段云计算平台
docker→kvm→openstack云计算
当然每个阶段找一些合适的项目练手是必须的, 可以巩固相关知识点,了解其作用及相关的应用问题等等。

物联网、大数据及人工智能都是近年来互联网行业比较火热的话题,三者之间具有非常紧密的联系。想探讨物联网、大数据及人工智能之间如何融合,首先需要了解其基本概念。

概念

1、物联网

根据百度百科的解释,物联网(InternetofThings,IoT)是一个基于互联网、传统电信网等的信息承载体,它让所有能够被独立寻址的普通物理对象形成互联互通的网络(万物互联)。物联网网络架构设计由感知层、网络层及应用层组成,分别实现数据采集、数据传输及数据应用的功能。目前,物联网已经广泛应用于智慧医疗、智慧环保、智慧城市、智能家居及物流等领域。

2、大数据

大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据具有体量大(Volume)、及时性(Velocity)、多样性(Variety)、低价值密度(Value)及真实性(Veracity)的“5V”特性。

3、人工智能

人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。目前,人工智能正在改变各行各业的传统模式,作为人工智能分支的机器学习/深度学习已经广泛用于自然语言处理(NLP)、计算机视觉(CV)、机器翻译及推荐系统等领域。

深度融合

物联网、大数据、人工智能三者之间相辅相成,可以形成一个闭环通路。物联网作为智能感知层,主要负责采集现场的数据并将数据上传至分布式数据库中;大数据作为数据存储层,将经过ETL处理后的数据保存到分布式文件系统(HDFS)或数据仓库(HIVE)中;人工智能作为应用层,可利用sparkml或tensorflow实现相关的机器学习或深度学习算法,对存储在HDFS或HIVE中的数据进行数据挖掘。

应用案例

目前,物联网、大数据、人工智能已经广泛用于智慧城市、智慧环保、智慧交通等领域。以智慧环保中的空气预警为例,首先,物联网可以作为智慧感知层,安装在客户现场的空气监测设备采集的空气质量信息通过网络传输数据中心;而后,利用大数据ETL工具(spark、hive)进行数据清洗并存储至分布式数据库/文件系统/数据仓库中;最后,利用人工智能相关技术进行大数据分析(sparkml、tensorflow),预测未来若干天的空气质量,并以此辅助进行科学决策及改善环境。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/dianzi/13370270.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-07-23
下一篇 2023-07-23

发表评论

登录后才能评论

评论列表(0条)

保存