第一次课笔记

第一次课笔记,第1张

第一次课笔记 第一次课笔记 成绩分布
  1. 统计基础 20
  2. 传统机器学习 20
  3. 深度学习 20
  4. presentation 40
数据导论

大数据的产生:网络世界、物理世界、人类社会
大数据的数据量到底有多大: TB(10^12) PB(10^15) EB(10^18) ZB(10^21)
一般认为能处理PB级别的数据及有大数据处理的能力。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UQSwslCH-1634888843141)(2021-09-13-20-03-10.png)]

从数据->知识->决策
计算机是一个concrete的东西
计算科学->数据科学
对应:经验决策->数据决策
模型驱动->数据驱动 idea:车辆动力学模型 ->机器学习估计模型(典型的模型驱动到数据驱动)
4v:
volume 媒体信息爆炸
variety 数据复杂、多模、异构
velocity 数据变化 速度快
veracity 要求数据准确

大数据计算面临的挑战:

  1. 大数据的异构性、非结构性
  2. 大数据的复杂性、不确定性
  3. 大数据处理的实时性、时效性
  4. 大数据的系统复杂性(复杂、多态)

probability 概率

因果分析(传统方法:probability)or关联分析(大数据方法)

传统方法:probability)or关联分析(大数据方法)

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/4684254.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-07
下一篇 2022-11-07

发表评论

登录后才能评论

评论列表(0条)

保存