大数据专业主要学科目如下:
数据科学与大数据技术(理学学位),以北京大学为例,主要课程包括:概率论、数理统计,应用多元统计分析, 实变函数,应用回归分析,贝叶斯理论与算法。
应用时间序列分析,统计计算,统计机器学习,程序设计实习,数据结构与算法,分布与并行计算,算法设计与分析,数据库概论,自然语言处理导论,数值与计算方法,人工智能,最优化方法,深度学习等。
数据科学与大数据技术(工学学位),以中国人民大学为例, 该专业由统计学院、信息学院、统计与大数据研究院、数学科学研究院联合授课,为应对大数据时代带来的机遇与挑战培养专业的数据科学人才。
主要课程包括:数学分析、高等代数、普通物理数学与信息科学概论、数据结构、数据科学导论、程序设计导论、程序设计实践、离散数学、概率与统计、算法分析与设计、数据计算智能、数据库系统概论。
计算机系统基础、并行体系结构与编程、非结构化大数据分析、数据科学算法导论、数据科学专题、数据科学实践、互联网实用开发技术、抽样技术、统计学习、回归分析、随机过程。
以上内容参考:知乎
大数据具体分为:基础阶段、存储阶段、架构设计阶段、实时计算阶段、数据采集阶段、商业实战阶段。
大数据的学习内容有很多,具体包括如下:
1、 大数据基础阶段: Linux、 Docker、 KVM、MySQL基础、Oracle基础、 MongoDB、 redis
2、大数据存储阶段: hbase、hive、 sqoop
3、大数据架构设计阶段: Flume分布式、 Zookeeper、 Kafka
4、大数据实时计算阶段: Mahout、 Spark、 storm
5、大数据数据采集阶段: Python、 Scala
6、大数据商业实战阶段:实 *** 企业大数据处理业务场景、分析需求、解决方案实施、综合技术实战应用。
大数据的重要性:
大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据有大量(Volume)、高速(Velocity)、多样(Variety)、低价值密度(Value)、真实性(Veracity)五大特点。它并没有统计学的抽样方法,只是观察和追踪发生的事情。大数据的用法倾向于预测分析、用户行为分析或某些其他高级数据分析方法的使用。
对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
01大数据技术专业属于交叉学科:以统计学、数学、计算机为三大支撑性学科;生物、医学、环境科学、经济学、社会学、管理学为应用拓展性学科。还需要学习数据采集、分析、处理软件,学习数学建模软件及计算机编程语言等,知识结构是二专多能复合的跨界人才(有专业知识、有数据思维)。
大数据专业主要学:统计学、数学、社会学、经济金融、计算机
以中国人民大学为例
基础课程:数学分析、高等代数、普通物理数学与信息科学概论、数据结构、数据科学导论、程序设计导论、程序设计实践。
必修课:离散数学、概率与统计、算法分析与设计、数据计算智能、数据库系统概论、计算机系统基础、并行体系结构与编程、非结构化大数据分析。
选修课:数据科学算法导论、数据科学专题、数据科学实践、互联网实用开发技术、抽样技术、统计学习、回归分析、随机过程。
另外学习大数据必须要学习大数据中心常识,大数据技术体系很复杂,与物联网、移动互联网、人工智能、云核算等都有着精密的关系。所以,Haoop生态体系、HDFS技术、HBASE技术、Sqoop运 用流程、数据仓库东西HIV、大数据离线剖析Spark、Python言语、数据实时剖析Storm等都是学习大数据需要了解和掌握的。
从事大数据工作,免不了要分析数据。如果从事数据剖析师,就需要了解一定的数学常识。需要有一定的公式核算能力,了解常用计算模型算法。而如果从事数据发掘工程师,就需要能够熟练运用各类算法,对数学的要求是很高的。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)