“阿尔法狗”为什么厉害
来源: 人民日报
谷歌的围棋人工智能程序和人类围棋冠军之间的比赛,堪称人工智能发展的一个重要里程碑,也让全世界的目光聚焦在人工智能这个热门科技领域。谷歌的人工智能程序是怎样赢了人类?人工智能对人类来说到底意味着什么,会带来什么?它会不会有一天在智能上也超过人类?
本版近期推出“关注‘人机大战’”系列报道上下篇,尝试揭开谷歌围棋人工智能程序赢得比赛的秘密,并分享相关专家对人工智能未来前景的预测。
——编者
从3月9日开始,一场人与机器的围棋大战吸引了全世界的目光。这场大战在韩国首尔上演,一直持续到15日,共5轮。大战之所以举世瞩目,是因为对战的双方是世界围棋冠军李世石与围棋人工智能程序AlphaGo。令人惊叹的是,整个比赛过程中,AlphaGo的表现都堪称完美,最终以4:1击败李世石。
这个战胜人类世界围棋冠军的AlphaGo程序到底是何方神圣?它为什么如此厉害?
“阿尔法狗”是什么?
一款人机对弈的围棋程序,棋艺不是开发者教给它的,而是“自学成才”
AlphaGo程序是美国谷歌公司旗下DeepMind团队开发的一款人机对弈的围棋程序,被中国棋迷们戏称为“阿尔法狗”。游戏是人工智能最初开发的主要阵地之一,比如博弈游戏就要求人工智能更聪明、更灵活,用更接近人类的思考方式解决问题。
1997年,IBM的“深蓝”计算机首次击败国际象棋世界冠军卡斯帕罗夫,成为人工智能战胜人类棋手的第一个标志性事件。此后近20年间,计算机在诸多领域的智力游戏中都击败过人类。但在围棋领域,人工智能却始终难以逾越人类棋手。直到2015年,由谷歌开发的这款“阿尔法狗”程序才首次战胜欧洲围棋冠军樊麾。
为什么对于人工智能而言,围棋的难度这么大?中国自动化协会副理事长、秘书长王飞跃说:“首先,围棋的可能性太多。围棋每一步的可能下法非常多,棋手起手时就有19×19=361种落子选择。一局150回合的围棋可能出现的局面多达10170种。其次,是规律太微妙,在某种程度上落子选择依靠的是经验积累而形成的直觉。此外,在围棋的棋局中,计算机很难分辨当下棋局的优势方和弱势方。因此,围棋挑战被称作人工智能的‘阿波罗计划’。”
既然围棋对于人工智能来说这么难攻克,那么对于AlphaGo程序的设计者来说,是否也需要具备很高的围棋水平?
“这个不需要,设计者们只需要懂得围棋的基本规则即可。AlphaGo背后是一群杰出的计算机科学家,确切地说,是机器学习领域的专家。科学家利用神经网络算法,将棋类专家的比赛记录输入给计算机,并让计算机自己与自己进行比赛,在这个过程中不断学习训练。某种程度上可以这么说,AlphaGo的棋艺不是开发者教给它的,而是‘自学成才’的。”王飞跃说。
谷歌旗下的deepmind公司通过深度强化学习训练的阿尔法狗围棋。根据查询相关资料信息显示,阿尔法狗围棋是由DeepMind公司开发的强大的计算机围棋程序,该程序使用了深度强化学习来训练,这意味着它学会了如何从实际游戏经验中学习,让它能够从这些棋局中学习到有用的信息,从而在围棋比赛中取得更好的表现。
要想战胜阿尔法狗,首先要了解它的死穴在哪里。兵法里最重要的一条,“知己知彼,百战百胜”。但现在一众国手九段棋手们早已把它忘到脑后了。他们所有做的事,都是费尽心机怎么钻进阿尔法狗埋伏圈。这样焉有不败之理。
阿尔狗本身有死穴,它的程序设计师更有知识和技艺的缺欠和盲点。棋手们只要改变原来的思维模式,让棋盘变得无比巨大,所有的局部变化都只走一点,在全盘统筹做组合进攻和大规模的弃子求变,做大局观的运营和判断,这样就足以致阿尔法狗于死地。
这其中的道理在哪里呢?
首先,阿尔法狗有一个致命死穴,就是纵然它有天大的计算能力,也无法穷尽围棋的变化。
程序设计师为了绕开这个死穴,在阿尔法狗的程序设计上,采取了两步走的方式。
第一步,把全局分成若干个局部,这样一来,每一个局部的变化量大大减少,阿尔法狗的计算能力超强的优势就发挥出来了。
所以当棋手在一个局部同阿尔法狗较量的时候,如果把这里的变化都走完,就会处于下风。因为阿尔法狗的程序设计是局部最正确的变化,每一种变化它都不会错。 而棋手则有的定式和局部变化熟悉,有一些并不太熟悉,需要临场思考,这样在时间上就处于劣势。同时棋手的情绪会随着比赛的进程有变化,耐力和注意力也根本无法同机器相比。所以每一个局部的变化走完,棋手都很难占到便宜。这样多个局部作战的结果累计起来,棋手根本无法占到上风。
阿尔法狗设计的第二步,是它每做一些局部的作战之后,它的程序设计就会帮助它做全局优劣的判断。
而全局判断的依据,则是给它输入了巨量的人类优秀棋手对局数据,结合那些棋形的过往胜率,并辅以人工的判断和分析,给它做参考。所以,阿尔法狗对局势的判断是在人类过往的对弈思考模式上建立和获得的。
对阿尔法狗来说,程序设计师就是它的眼睛和大脑。所以,对棋手来说,要想战胜阿尔法狗,其实首先要战胜它的程序设计师。
那么怎么才能战胜它的程序设计师呢?
阿尔法狗的主要程序设计师是业余六段的台湾籍工程师。另外请的雇佣军是欧洲围棋冠军,一位专业三段棋手。这二位的实力要差国手们几条街。
棋手们作战的原则第一条就是作战目的要极度隐蔽。根本不让这两位二流的棋手看懂。
坚决摒弃局部作战定型的方式,把全盘做为一个整体,从始至终都在做全局经营。
所有的局部,只走一点,不把变化走尽,放在那里。而是大规模经营全局。
如果在局部,阿尔法狗根据它的计算,去贪占便宜,那它就会在大局上落后。而阿尔法狗如果跟着棋手走,就进了棋手圈套。
棋手就把全局做取舍安排,要大胆的舍弃一些局部,从全局来考量,用几块棋扭在一起,算大账。
比如说,全部打散了之后,有十多个没有走定型的部分,把哪些部分一步一步地放弃做诱饵,计算自己另外可以获得部分的大小,取大舍小,坚决不把变化走尽。
请注意,当阿尔法狗的程序设计师根本看不懂棋手大规模作战的意图的时候,他的程序设计必然会落在下风。而全盘变化的整体考量,正是针对阿尔法狗致命的死穴。
程序设计师在自己棋力达不到水准的时候,根本无法从全局考量来设计程序,而全局的变化,就算阿尔法狗有天大的本事,也是无法算清的。因为这其中已经不仅仅是变化和计算的概念了,而是把人类的智慧和兵法的变化融入其中了。
在这样一种模式下,阿尔法狗的优势无法发挥,而它的程序师也无法很快改造它和提升它的竞技能力。棋手们假以时日,就会占据上风。
阿尔法狗是美国的。
阿尔法狗是第一个击败人类职业围棋选手,第一个战胜围棋世界冠军的人工智能程序,由谷歌旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发,其主要工作原理是“深度学习”,运用到了很多新技术,如神经网络、深度学习、蒙特卡洛树搜索法等,使其实力有了实质性飞跃。阿尔法围棋系统主要由策略网络、快速走子、价值网络、蒙特卡洛树搜索四部分组成。
仔细想一想就知道不靠谱,如果靠机器就能赚到钱,那还要人脑干什么,机器交易系统早就是股神了,而且这些东西都是人写好的程序,电脑只是照章执行好吧,那就说这个机器和设计它的人一样聪明,如果设计者真的是个高手,那他完全没必要靠这个工作赚钱,自己做早就发财了——所以,这个机器很值得怀疑!!!个人意见,希望能有点用。
以上就是关于“阿尔法狗”为什么厉害全部的内容,包括:“阿尔法狗”为什么厉害、谷歌旗下的deepmind公司通过什么学习训练的阿尔法狗围棋、阿尔法狗没那么可怕,它的死穴是程序设计师!等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)