那个唯一赢过AlphaGo的棋手,今天退役了
在技术的不断突破极限的同时,研发者们的工作重心也开始向商用转移。
李世石宣布退役了,就此结束了在韩国棋院共计24年零7个月的职业围棋生涯,而他也是迄今为止唯一战胜过AlphaGo的棋手。
“神之一手”,5番大战的一次胜利,是人类棋手的“唯一”
2016年3月的那场“人机大战”,各中精彩至今仍历历在目,而这场比赛也成就了李世石职业生涯最辉煌一战——5番大战中,李世石在第4局下出“神之一手”,取得人类棋手对阵AlphaGo正式比赛中的唯一一局胜利。
如果要用一个词形容这场比赛,“盛况空前”再合适不过了,因为这场比赛在正式开始之前,就已获得了全球范围内的关注。而当时有关这场比赛最终胜负争论的争论,远胜于曾经的“深蓝”。
实际上早在1997年,IBM就曾凭借“深蓝”击败了等级分排名世界第一的棋手加里·卡斯帕罗夫,让很多业内人士认识到了机器的强大。
可能正是因为有了这支“预防针”,面对AlphaGo大多数人不再自信和笃定认为“人脑无敌”,反而更加期待机器的表现。而当时已是世界冠军、围棋九段的李世石能够接受邀约,不仅令人诧异也更加让人期待,这场比赛也因此获得了全球范围内极高的关注,更将人工智能和深度学习彻底地推到了大众面前。
作为谷歌全力打造的人工智能程序,AlphaGo所依赖的是两个不同神经网络“大脑”——监督学习的策略网络和价值网络合作进行下棋的,它们均由多层神经网络构成,通过多层启发式二维过滤器处理围棋棋盘的定位,并通过十几个完全连接的神经网络层进行信息分类和逻辑推理,产生局面判断。
而相较于“深蓝”触及的国际象棋领域,围棋的复杂程度远超想象。在共计361格的围棋棋盘中,黑白棋子随着战局的不断推进越来越多,这也就意味着每多一颗棋子未知的可能就会有指数倍的增加,变化是无止尽的。甚至有人夸张的认为,围棋的复杂度数量远超于宇宙原子数量。
实际上在李世石之前,AlphaGo也曾与人类棋手对弈过。2015年10月,AlphaGo和当时连任2013-2015年欧洲围棋冠军的樊麾进行了5局无让子比赛,获得了“满堂红”。
在此之后,谷歌邀请樊麾加入了AlphaGo的研发工作中,这也是为什么在AlphaGO和李世石的比赛中,樊麾是总裁判长的主要原因。也正是因为有了专业棋手的加入,才让AlphaGo有了后面的“快速进化”。
AlphaGo持续进化,Master、Zero相继登场
作为“教练”,在AlphaGO和李世石比赛之后,樊麾几乎每个月都会分出一半的时间飞往DeepMind总部与AlphaGo对弈,检验它的最新学习成果。到2016年7 月,AlphaGo出现在了世界围棋排名网站Go Ratings排名首位,总积分超越柯洁,成为了第一个登上围棋领域世界榜首的AI。
而就在很多人认为AlphaGo热度正在慢慢减退之时,2016年12月29日到2017年1月4日,短短5天时间,棋手“Master”在网络围棋平台横扫众多围棋名将,在快棋对决中多次击败了包括聂卫平、柯洁、朴廷桓、井山裕太在内的数十位中日韩围棋高手,创下了60局全胜的战绩。
就在大家对“Master”身份一筹莫展的时候,对战最后一天它的“马甲”终于掉了,谷歌自爆神秘账号“Master”就是AlphaGo的最新版本。当时聂卫平给它的评价是,“Master技术全面,从来不犯错,这一点是它最大的优势。”
2017年5月,在“万众期待”下人类排名第一的棋手柯洁与AlphaGo正式展开了对决。只是面对进化了的AlphaGo,柯洁三局皆败,然而这一切都并未结束。
仅仅5个月后,Deepmind就重磅发布了“0基础学习”的AlphaGo Zero,即“在没有任何人类围棋对弈数据的情况下,直接通过自我纯强化学习”。更值得一提的是,AlphaGo Zero只自我训练了3天,就以100:0的战绩击败曾经的AlphaGo。
面对这样的强者,柯洁能表达的就只有这个了:
但实际上,围棋已经“围不住”AI和深度学习技术的发展了。
人机大战领域扩散,商用落地正在进行时
可以看到,在AlphaGo于围棋领域一战成名后,德扑、游戏甚至是“国粹”麻将,都被AI攻克了,如DeepStack成为首个在一对一无限注德扑中战胜人类玩家的人工智能、AlphaStar称霸星际争霸2、Suphx成为国际知名的专业麻将平台“天凤”第一个荣升十段的AI系统等,这也让越来越多的人认识到深度学习前景的可观性。
IDC今年下半年发布的《中国深度学习平台市场份额调研》的报告显示,在AI技术使用方面,接受调研的企业和开发者中,86.2%选择使用开源深度学习框架,在AI不断走向产业化的过程中,深度学习平台已经成为企业和开发者应用AI技术必备的助攻武器。而在技术的不断突破极限的同时,研发者们的工作重心也开始向商用转移。
以AlphaGo为例,DeepMind CEO哈萨比斯就曾在被问及未来发展方向时表示,“AlphaGo是人工智能,会自己学习,是可以‘移植’的,所以我们已经开始将它和医疗、机器人等进行结合了。”
当前,除谷歌Facebook、百度、亚马逊、阿里、腾讯等头部厂商之外,包括科大讯飞、商汤、旷视、思必驰、地平线等创企均有深度学习相关产品推出,并在医疗、芯片、自动驾驶、机器人、计算机视觉、语音识别等领域落地商用。可以预见,未来有关深度学习的市场规模将快速扩展。
关于李世石
李世石,1983年生,韩国著名围棋棋手,世界顶级围棋棋手。
1995年入段,1998年二段,1999年三段,2003年因获LG杯冠军直接升为六段,2003年4月获得韩国最大棋战KT杯亚军,升为七段,2003年7月获第16届富士通杯冠军后直接升为九段,2006、2007、2008获韩国围棋大奖最优秀棋手大奖(MVP)。
李世石属于典型的力战型棋风,善于敏锐地抓住对手的弱处主动出击,以强大的力量击垮对手,他的攻击可以用“稳,准,狠”来形容,经常能在劣势下完成逆转。
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新