考研复试——专业前沿知识

考研复试——专业前沿知识,第1张

1、机器学习(大学中学习的微积分、线性代数、概率论都需要用在机器学习中)

(1)机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。

(2)机器学习的分类(按学习方式分类)
1)监督学习(回归/分类算法)
2)无监督学习(聚类算法)
3)半监督学习
4)强化学习

(3)机器学习跟模式识别,统计学习,数据挖掘,计算机视觉,语音识别,自然语言处理等领域有着很深的联系。

2、NLP

(1)自然语言处理(Natural Language Processing,简称NLP)就是用计算机来处理、理解以及运用人类语言。NLP有两个核心任务是自然语言生成和自然语言理解。

(2)研究内容:信息检索、机器翻译、文档分类、问答系统、信息过滤、自动文摘、信息抽取、文本挖掘、舆情分析、机器写作、文稿机器校对和语音识别。

3、常见的神经网络模型

(1)全连接神经网络:最常见的神经网络,又称多层感知机,有三种基本类型的层:输入层、隐藏层和输出层。
(2)卷积神经网络:卷积神经网络(Convolutional Neural Network,CNN),通过卷积层与池化层的叠加实现对输入数据的特征提取,最后连接全连接层实现分类。对于图像处理有出色表现,在计算机视觉中得到了广泛的应用。
(3)循环神经网络:循环神经网络(Recurrent Neural Network, RNN)是一类以序列数据为输入,在序列的演进方向进行递归且所有节点(循环单元)按链式连接的递归神经网络。其包含环和循环,因此被称为“环”。

4、云计算

(1)云计算(cloud computing)是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。
(2)云计算三种模式:
1)laaS(基础设施即服务):将基础设施和存储作为服务出租,通常分为三种用法:公有云、私有云和混合云。
2)Pass(平台即服务):以服务器平台或者开发环境作为服务进行提供
3)SaaS(软件即服务):一种通过Internet提供软件的模式,厂商将应用软件统一部署在自己的服务器上,客户可以根据自己实际需求,通过互联网向厂商订购所需的应用软件服务
(3)云计算三种类型:
1)公有云:面向所有用户提供服务
2)私有云:只为特定用户提供服务
3)混合云:综合公有云和私有云的特点
(4)云计算核心技术:
1)虚拟化技术
2)分布式存储技术

5、大数据

(1)大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
(2)大数据特点:数据量大、数据价值密度低、数据多样性和数据增长速度快。
(3)大数据技术栈:
1)基础架构: Hadoop
2)分布式文件系统: HDFS
3)数据仓库: Hive
4)存储引擎: Kudu
5)分布式数据库: HBase
6)实时框架:Flink

6、人工智能

(1)人工智能是通过机器对人类智能过程进行的模拟。
(2)四大分支:

(3)三种形态:

(强人工智能可以实现)
(4)人工智能、机器学习和深度学习关系

7、深度学习

(1)深度学习是基于深度置信网络提出非监督贪心逐层训练算法,是机器学习中一种基于对数据进行表征学习的方法,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据。应用:计算机视觉、语音识别,自然语言处理。
(2)例子:比如我这里有一万张男性照片,一万张女性照片,我们把这些照片进行数据处理后,传到深度学习框架中,让框架熟悉这些照片的规律。之后我们给框架上传一张人类照片,框架就能帮我们分辨出是男性还是女性。这个过程就是深度学习。
(3)深度学习的深度是什么:我认为深度学习的深度在于特征的层次的抽象提取,因为浅层一般提取的都是诸如纹理,结构,色彩这些基础的特征。
(4)深度学习是不是越深越好:理论上来说网络越深表达能力越强,能处理的训练数据也更多,但是训练算法未必支持。
(5)常见的深度学习算法:卷积神经网络、循环神经网络、生成对抗网络、深度强化学习等等。

8、数据挖掘

(1)数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。、
(2)常见的数据挖掘算法:朴素贝叶斯/决策树/支持向量机/k均值聚类算法等等。

9、物联网

(1)物联网是指通过各种信息传感设备,实时采集任何需要监控、连接、互动的物体或过程等各种需要的信息,与互联网结合形成的一个巨大网络。其目的是实现物与物、物与人,所有的物品与网络的连接,方便识别、管理和控制。
(2)物联网的创建应用:智能家居、智能医疗、智能城市、智能环保、智能交通、智能物流、智能校园等等。

10、区块链

区块链,就是一个又一个区块组成的链条。每一个区块中保存了一定的信息,它们按照各自产生的时间顺序连接成链条。这个链条被保存在所有的服务器中,只要整个系统中有一台服务器可以工作,整条区块链就是安全的。这些服务器在区块链系统中被称为节点,它们为整个区块链系统提供存储空间和算力支持。如果要修改区块链中的信息,必须征得半数以上节点的同意并修改所有节点中的信息,而这些节点通常掌握在不同的主体手中,因此篡改区块链中的信息是一件极其困难的事。相比于传统的网络,区块链具有两大核心特点:数据难以篡改和去中心化。基于这两个特点,区块链所记录的信息更加真实可靠,可以帮助解决人们互不信任的问题。

11、大数据和机器学习(人工智能)的关系

大数据是机器学习(人工智能)的基础,它们之间在通常情况下互相促进、相依相存。

12、大数据与云计算之间的关系

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/925376.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-16
下一篇 2022-05-16

发表评论

登录后才能评论

评论列表(0条)

保存