大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分。据 IDC 的调查报告显示:企业中 80%的数据都是非结构化数据,这些数据每年都按指数增长 60%。
大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本看起来很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)