大数据库和人工智能有什么关系吗?

大数据库和人工智能有什么关系吗?,第1张

人工智能里面有一部分算法是需要数据的,首先要进去数据,然后才能学习。

比如一个大数据库叫ImageNet,有十几亿张图片,用了这么大量的图片,我们才能训练我们的深度神经网络去做图片中猫猫、狗狗、车辆的识别。

如果没有这些海量的数据,很多机器学习算法是不能用的,像我们现在看视频网站它是面向百亿特征,千亿参数,万亿样本,你没有万亿样本就支撑不了百亿特征,你可能要有一个亿的样本才有可能支撑百万特征,而且深度学习是需要海量特征做特征工程的,所以这个时候大数据实际是很多机器学习算法得以能够发展的基础,但是发展到一定程度,有些算法它又突然脱离数据了,比如说我们做增强学习,像早期的阿法狗(AlphaGo),它学了几十万专业棋手之间的对局,它是大师,那它就下得很好,后来的阿法Zero(Alpha Zero),它是自己和自己下棋,反正有规则,所以它的数据实际不是真的数据,是生成出来的,它没有用真实数据,但是它用了增强学习,所以说它最后下得比阿法狗还强。

人工智能需要有大数据支撑

人工智能主要有三个分支:

1.基于规则的人工智能

2.无规则,计算机读取大量数据,根据数据的统计、概率分析等方法,进行智能处理的人工智能;

3.基于神经元网络的一种深度学习。

基于规则的人工智能,在计算机内根据规定的语法结构录入规则,用这些规则进行智能处理,缺乏灵活性,不适合实用化。因此,人工智能实际上的主流分支是后两者。

而后两者都是通过“计算机读取大量数据,提升人工智能本身的能力/精准度”。如今,大量数据产生之后,有低成本的存储器将其存储,有高速的CPU对其进行处理,所以才有了人工智能后两个分支的理论得以实践。由此,人工智能就能做出接近人类的处理或者判断,提升精准度。同时,采用人工智能的服务作为高附加值服务,成为了获取更多用户的主要因素,而不断增加的用户,产生更多的数据,使得人工智能进一步优化。

大数据挖掘少不了人工智能技术

大数据分为“结构化数据”与“非结构化数据”。

“结构化数据”是指企业的客户信息、经营数据、销售数据、库存数据等,存储于普通的数据库之中,专指可作为数据库进行管理的数据。相反,“非结构化数据”是指不存储于数据库之中的,包括电子邮件、文本文件、图像、视频等数据。

目前,非结构化数据激增,企业数据的80%左右都是非结构化数据。随着社交媒体的兴起,非结构化数据更是迎来了爆发式增长。复杂、海量的数据通常被称为大数据。

但是,这些大数据的分析并不简单。文本挖掘需要“自然语言处理”技术,图像与视频解析需要“图像解析技术”。如今,“语音识别技术”也不可或缺。这些都是传统意义上人工智能领域所研究的技术。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9432935.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-28
下一篇 2023-04-28

发表评论

登录后才能评论

评论列表(0条)

保存