- 统计基础 20
- 传统机器学习 20
- 深度学习 20
- presentation 40
大数据的产生:网络世界、物理世界、人类社会
大数据的数据量到底有多大: TB(10^12) PB(10^15) EB(10^18) ZB(10^21)
一般认为能处理PB级别的数据及有大数据处理的能力。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UQSwslCH-1634888843141)(2021-09-13-20-03-10.png)]
从数据->知识->决策
计算机是一个concrete的东西
计算科学->数据科学
对应:经验决策->数据决策
模型驱动->数据驱动 idea:车辆动力学模型 ->机器学习估计模型(典型的模型驱动到数据驱动)
4v:
volume 媒体信息爆炸
variety 数据复杂、多模、异构
velocity 数据变化 速度快
veracity 要求数据准确
大数据计算面临的挑战:
- 大数据的异构性、非结构性
- 大数据的复杂性、不确定性
- 大数据处理的实时性、时效性
- 大数据的系统复杂性(复杂、多态)
probability 概率
因果分析(传统方法:probability)or关联分析(大数据方法)
传统方法:probability)or关联分析(大数据方法)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)