第一个战胜围棋世界冠军的人工智能程序是什么?

第一个战胜围棋世界冠军的人工智能程序是什么?,第1张

阿尔法狗(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能程序,由谷歌(Google)公司的团队开发。其主要工作原理是“深度学习”。

2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。围棋界公认阿尔法围棋的棋力已经超过人类职业围棋顶尖水平。

起源

围棋,起源于中国,中国古代称为“弈”,可以说是棋类之鼻祖,围棋至今已有4000多年的历史。据先秦典籍《世本》记载:“尧造围棋,丹朱善之。”晋张华在《博物志》中继承并发展了这种说法:“尧造围棋,以教子丹朱。若白:舜以子商均愚,故作围棋以教之。”

1964年版的《大英百科全书》就采纳这种说法,甚至将其确切年代定在公元前2356年。

唐代诗人皮日休所作的《原弈》认为:“弈之始作,必起自战国,有害诈争伪之道,当纵横者流之作矣。岂曰尧哉!”

明朝陈仁锡在《潜确类书》中又提出“乌曹作博、围棋”。乌曹相传是尧的臣子,有的人又说他是夏桀的臣子。后来,董斯张的《广博物志》、张英的《渊鉴类函》等也采录了这种说法。

阿尔法狗是一种使用深度强化学习算法的人工智能计算机程序,其核心算法是基于深度学习和强化学习的蒙特卡罗树搜索算法。

具体来说,阿尔法狗采用了一种名为“深度强化学习”的算法,它结合了深度神经网络和强化学习的技术,可以让计算机程序通过自我学习和不断的实战经验来提高棋力和策略水平。

在阿尔法狗的算法中,首先使用深度神经网络来分析和学习围棋的棋盘局面,获得对当前局面的评估值。然后,利用蒙特卡罗树搜索算法来评估每个可行的棋步,并根据评估值来选择最佳的下一步棋着法。在每次迭代中,阿尔法狗会根据实际对局的结果来更新自己的神经网络参数和策略,以不断提高自己的棋力和水平。

总的来说,阿尔法狗的算法是一种基于深度学习和强化学习的蒙特卡罗树搜索算法,它利用神经网络的能力来学习和评估围棋的局面,同时通过强化学习的技术来不断优化自己的策略和棋力。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/8153144.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-13
下一篇 2023-04-13

发表评论

登录后才能评论

评论列表(0条)

保存