平分秋色

平分秋色,第1张

平分秋色 为什么顶级围棋选手还可以和人工智能平分秋色而象棋选手却不能?

科普一下。

现在人工智能的发展已经到了在各种棋类游戏中没有人能战胜的阶段。

人类围棋的顶尖棋手和AlphaGoMaster的网络对战成绩是0:60。

而Master还不是AlphaGo的最高级版本。

而1997年IBM的深蓝战胜了等级分排名世界第一的棋手加里·卡斯帕罗夫。

战绩 3.5:2.5 (2胜1负3平)。

19年后Google的AlphaGo Master也战胜了等级分排名世界第一的棋手柯洁。

那么现在人类顶尖棋手和AI到底有多大差距呢?唯一战胜过AlphaGoLee的韩国著名顶尖棋手李世石的隐退棋是和韩国的AI韩豆下的。

AI让两子,黑棋贴3又3/4子。

在这种条件下开局AI的胜率已经无限接近于1%。

但是结果还是AI2:1胜出了。

为什么AI会这么强大?它是怎么超越人类的呢?其实AI的成长过程一直是仿生的过程。

所有的棋类比赛较量的都是规则下进行计算的能力。

1997年版本的深蓝运算速度为每秒2亿步棋。

1997年的深蓝可搜寻及估计随后的12步棋,而一名人类象棋好手大约可估计随后的10步棋。

正如中国古代军事家孙子所说:"夫未战而庙算胜者,得算多也。

未战而庙算不胜者,得算少也。

多算胜,少算不胜,而况于无算乎!" 。

那么为什么计算机要19年后才能在围棋上战胜人类呢?还是计算的问题。

围棋对AI的挑战难点在棋盘空间。

国际象棋的空间状态是1043。

而围棋是10170个状态空间。

这样的游戏具有高分支因子。

围棋中的可能场景的数量要大于宇宙中的原子数。

光照顾了棋局的宽度(变化)就照顾不了棋局的深度(考虑的步数)。

所以围棋职业棋手2016年之前一致认为计算机不可能下过人类顶尖棋手。

从当时的情况看计算机确实是有点“机关算尽”了。

于是科学家们开始研究新的思路。

在资源有限的情况下人是怎么办的?最典型的例子是种花、果时要打尖、疏果。

因为植物的营养是有限的。

不打尖、疏果就不能得到好的结果。

围棋棋盘上的空间状态虽然多但是每个空间状态的价值是不同的。

所以对变化的计算要剪枝。

问题转化为应该剪除谁?解决这个问题的就是蒙特卡洛算法和神经元网络的深度学习

什么是蒙特卡洛算法?举个例子:有一个箱子里边有无数个苹果。

想找出最大的。

但是人从外边看不到苹果的大小。

每次可以随机取出一个。

然后和上一次的比较。

大的留下。

这样重复100次、1000次之后是什么结果呢?留下的不一定是最大的苹果,但一定是在目前最接近最大苹果的苹果。

和蒙特卡洛算法对应的是拉斯维加斯算法。

也举个例子:还是,一个箱子里边有无数把钥匙。

想找出能打开一把锁的钥匙。

还是每次可以随机取出一把来试。

打不开扔掉。

这样重复100次、1000次之后是什么结果呢?有可能碰上了,但是不保证一定能碰上。

人下棋时是通过过往的经验来做选择。

AI也是通过过往的经验找出最接近正确答案的值给每一个选择点赋值。

而人们看到的是每着的胜率。

AI是怎么给每一个选择点赋值的呢?这就离不开神经网络和深度学习。

人能思考的物质基础是人的神经网络。

AI的神经网络系统就是仿生的结果。

有了这个物质基础就有了机器学习。

深度学习是机器学习的一部分。

深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对数据的解释有很大的帮助。

它的最终目标是让机器能够像人一样具有分析学习能力。

深度学习是一个复杂的机器学习算法,又分为有监督学习和无监督学习。

老师留作业,学生做习题集。

其实就是一种有监督学习。

通过做题掌握了解题规律。

于是考试时只要是做过的题型基本上都会。

现实生活中还常常会有这样的问题:缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。

很自然地,我们希望计算机能代我们完成这些工作,或至少提供一些帮助。

比如在没有计算机的情况下人通过对大量的数据长期观察思考,找到了克山病的原因。

但是这个研究发现其规律的过程长达几十年。

AI的无监督学习就是模拟人的这个学习过程。

可以加快人们对未知事物的理解。

深蓝和阿尔法狗最初都是用人类的棋谱喂养的。

比如战胜李世石的AlphaGo Lee就大约喂了16万人类棋谱和数万个人类人类总结的模式(定式)。

但是最后开源的AlphaGo Zero则是从零开始通过“左右互搏”自己通过超过1亿对局自己悟出的围棋真谛。

自学成才的AlphaGo Zero水平不但远超AlphaGo Lee,就连横扫千军的AlphaGo Master也不是AlphaGo Zero的对手。

这就是职业棋手说的AlphaGo Lee的棋还能看出高明的地方(因为有人类的影子),AlphaGo Zero的棋则净是看不懂的地方。

许多过去的共识被纠正。

数以万计的定式被废弃。

2005年左右《围棋天地》曾经有一个栏目是访问一线棋手:如果有围棋上帝的话你和他有多大差距。

记得当时一致的看法是让两子。

而现在顶尖棋手和AI的差距已经差了两个子。

那么AI是不是围棋上帝呢?肯定不是。

它只是接近最优解,而不是最优解。

也就是说AI只是相对真理,是绝对真理的一部分。

它并没有穷尽真理。

最好的例子就是“芈氏飞刀”。

这个定式是在流行AI定式的大形势下人类发明的定式。

最开始AI 也不认识,吃了亏后变成AI在一个时期里的常用定式。

AI 的发展还远没有达到尽头。

从AlphaGo Lee到AlphaGo Zero都有一个习惯就是见好就收。

前边优势很大但是当它算到怎么下都能赢的时候就会退让。

最后只赢一两目。

作为人类棋手的陪练这是不称职的。

所以人类要给它增加个性。

中国的AI星阵就加入了“不退让”的个性。

曾经有人预言AI会使围棋衰落。

我不这么认为。

古代无论东西方绘画都有追求像的趋势。

但是当照相机出现后,画得再像也赶不上照相机。

但是绘画仍然向前发展并没有衰落。

只不过现在追求的是意境和感受了。

围棋在商业因素的影响下从两日制演变到包干制的快棋。

人的能力在哪摆着,棋的质量不可能不受影响。

当信奉“天下武功唯快不破”的时代遇到任谁也快不过的AI。

这种“快”还有意义吗?

围棋也不能

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/bake/4350849.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-10-30
下一篇 2022-10-30

发表评论

登录后才能评论

评论列表(0条)

保存