大数据库和人工智能有什么关系吗？_sql

人工智能里面有一部分算法是需要数据的，首先要进去数据，然后才能学习。

比如一个大数据库叫ImageNet，有十几亿张图片，用了这么大量的图片，我们才能训练我们的深度神经网络去做图片中猫猫、狗狗、车辆的识别。

如果没有这些海量的数据，很多机器学习算法是不能用的，像我们现在看视频网站它是面向百亿特征，千亿参数，万亿样本，你没有万亿样本就支撑不了百亿特征，你可能要有一个亿的样本才有可能支撑百万特征，而且深度学习是需要海量特征做特征工程的，所以这个时候大数据实际是很多机器学习算法得以能够发展的基础，但是发展到一定程度，有些算法它又突然脱离数据了，比如说我们做增强学习，像早期的阿法狗(AlphaGo)，它学了几十万专业棋手之间的对局，它是大师，那它就下得很好，后来的阿法Zero(Alpha Zero)，它是自己和自己下棋，反正有规则，所以它的数据实际不是真的数据，是生成出来的，它没有用真实数据，但是它用了增强学习，所以说它最后下得比阿法狗还强。

人工智能需要有大数据支撑

人工智能主要有三个分支：

1.基于规则的人工智能；

2.无规则，计算机读取大量数据，根据数据的统计、概率分析等方法，进行智能处理的人工智能；

3.基于神经元网络的一种深度学习。

基于规则的人工智能，在计算机内根据规定的语法结构录入规则，用这些规则进行智能处理，缺乏灵活性，不适合实用化。因此，人工智能实际上的主流分支是后两者。

而后两者都是通过“计算机读取大量数据，提升人工智能本身的能力/精准度”。如今，大量数据产生之后，有低成本的存储器将其存储，有高速的CPU对其进行处理，所以才有了人工智能后两个分支的理论得以实践。由此，人工智能就能做出接近人类的处理或者判断，提升精准度。同时，采用人工智能的服务作为高附加值服务，成为了获取更多用户的主要因素，而不断增加的用户，产生更多的数据，使得人工智能进一步优化。

大数据挖掘少不了人工智能技术

大数据分为“结构化数据”与“非结构化数据”。

“结构化数据”是指企业的客户信息、经营数据、销售数据、库存数据等，存储于普通的数据库之中，专指可作为数据库进行管理的数据。相反，“非结构化数据”是指不存储于数据库之中的，包括电子邮件、文本文件、图像、视频等数据。

目前，非结构化数据激增，企业数据的80％左右都是非结构化数据。随着社交媒体的兴起，非结构化数据更是迎来了爆发式增长。复杂、海量的数据通常被称为大数据。

但是，这些大数据的分析并不简单。文本挖掘需要“自然语言处理”技术，图像与视频解析需要“图像解析技术”。如今，“语音识别技术”也不可或缺。这些都是传统意义上人工智能领域所研究的技术。

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/sjk/9432935.html

大数据库和人工智能有什么关系吗？

发表评论

评论列表（0条）