阿尔狗本身有死穴,它的程序设计师更有知识和技艺的缺欠和盲点。棋手们只要改变原来的思维模式,让棋盘变得无比巨大,所有的局部变化都只走一点,在全盘统筹做组合进攻和大规模的弃子求变,做大局观的运营和判断,这样就足以致阿尔法狗于死地。
这其中的道理在哪里呢?
首先,阿尔法狗有一个致命死穴,就是纵然它有天大的计算能力,也无法穷尽围棋的变化。
程序设计师为了绕开这个死穴,在阿尔法狗的程序设计上,采取了两步走的方式。
第一步,把全局分成若干个局部,这样一来,每一个局部的变化量大大减少,阿尔法狗的计算能力超强的优势就发挥出来了。
所以当棋手在一个局部同阿尔法狗较量的时候,如果把这里的变化都走完,就会处于下风。因为阿尔法狗的程序设计是局部最正确的变化,每一种变化它都不会错。 而棋手则有的定式和局部变化熟悉,有一些并不太熟悉,需要临场思考,这样在时间上就处于劣势。同时棋手的情绪会随着比赛的进程有变化,耐力和注意力也根本无法同机器相比。所以每一个局部的变化走完,棋手都很难占到便宜。这样多个局部作战的结果累计起来,棋手根本无法占到上风。
阿尔法狗设计的第二步,是它每做一些局部的作战之后,它的程序设计就会帮助它做全局优劣的判断。
而全局判断的依据,则是给它输入了巨量的人类优秀棋手对局数据,结合那些棋形的过往胜率,并辅以人工的判断和分析,给它做参考。所以,阿尔法狗对局势的判断是在人类过往的对弈思考模式上建立和获得的。
对阿尔法狗来说,程序设计师就是它的眼睛和大脑。所以,对棋手来说,要想战胜阿尔法狗,其实首先要战胜它的程序设计师。
那么怎么才能战胜它的程序设计师呢?
阿尔法狗的主要程序设计师是业余六段的台湾籍工程师。另外请的雇佣军是欧洲围棋冠军,一位专业三段棋手。这二位的实力要差国手们几条街。
棋手们作战的原则第一条就是作战目的要极度隐蔽。根本不让这两位二流的棋手看懂。
坚决摒弃局部作战定型的方式,把全盘做为一个整体,从始至终都在做全局经营。
所有的局部,只走一点,不把变化走尽,放在那里。而是大规模经营全局。
如果在局部,阿尔法狗根据它的计算,去贪占便宜,那它就会在大局上落后。而阿尔法狗如果跟着棋手走,就进了棋手圈套。
棋手就把全局做取舍安排,要大胆的舍弃一些局部,从全局来考量,用几块棋扭在一起,算大账。
比如说,全部打散了之后,有十多个没有走定型的部分,把哪些部分一步一步地放弃做诱饵,计算自己另外可以获得部分的大小,取大舍小,坚决不把变化走尽。
请注意,当阿尔法狗的程序设计师根本看不懂棋手大规模作战的意图的时候,他的程序设计必然会落在下风。而全盘变化的整体考量,正是针对阿尔法狗致命的死穴。
程序设计师在自己棋力达不到水准的时候,根本无法从全局考量来设计程序,而全局的变化,就算阿尔法狗有天大的本事,也是无法算清的。因为这其中已经不仅仅是变化和计算的概念了,而是把人类的智慧和兵法的变化融入其中了。
在这样一种模式下,阿尔法狗的优势无法发挥,而它的程序师也无法很快改造它和提升它的竞技能力。棋手们假以时日,就会占据上风。
不是防水,应该是系统问题AlphaGo研发者哈萨比斯:“错误出现在李世石白78这一手后,AlphaGo自我感觉良好,在程序的“值网络”(用于评估电脑胜率)中,误以为胜率达到70%,直到第87步才反应过来。察觉自己在第79手就犯了错。也就是说,人机系列赛以来,电脑很可能是第一次出现判断上的错误。李世石的白78,可能点中了电脑此前不为人知的"BUG",导致AlphaGo误读了局面,并由此产生了一系列崩溃反应。”
AlphaGo维护巩固学习小组负责人大卫·席尔瓦:“它通过自我对局来进行学习,这样有可能会存在缺陷。我们需要进行比赛,寻找缺陷,发现AlphaGo的极限。”
研发AlphaGo公司发言人:“AlphaGo不是万能的,它只是一个程序,还有待进一步完善。”
原因在于阿法狗—零”(AlphaGo Zero)的新程序不需要任何人类指导的条件下,迅速“自学成才”。为了赢得这场比赛,科学家在训练“阿法狗”时,同时用到了监督式学习(基于上百万种人类专业选手的下棋步骤)和基于自我对弈的强化学习。其训练过程长达几个月,用到多台机器和48个TPU(神经网络训练所需的专业芯片)。
此次在最新论文中,英国深度思维公司“阿法狗”项目主要负责人戴维·西尔弗、戴密斯·哈萨比斯及其同事,报告了新版“阿法狗”软件——“阿法狗—零”。与前辈版本在刚开始学习围棋时要依靠人类知识不同,新软件的学习从“零”开始,且单纯基于与自己的对弈,人类的输入仅限于棋盘和棋子,没有任何其他数据。“阿法狗—零”仅使用一台机器和4个TPU,依靠一张经过训练的神经网络来预测程序自身的棋步和棋局的赢家,在每次自我对弈中飞速进步。
通过几天的训练——包括近500万局自我对弈——“阿法狗—零”已能够超越人类并打败所有之前的“阿法狗”版本。在程序训练的过程中,它独立发现了人类用几千年才总结出来的围棋规则,还建立了新的战略,为这个古老的游戏带来新见解。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)