首页>要闻>悦读 悦读

为什么说AlphaGo的胜利是件惊天动地的大事?

2016年03月12日 09:49 | 来源:凤凰科技
分享到: 

“国际象棋和西洋棋与围棋不同,它们不需要选手对棋局做复杂的形势评估,”乔纳森·谢弗(Jonathan Schaeffer)说道,他是加拿大阿尔伯塔大学的计算机科学家,此前他的Chinook程序曾战胜过顶级的西洋棋选手。“在国际象棋和西洋棋中,只需简单的启发,你就知道下一步该怎么走,衡量各个棋子的价值是选手最重要的任务——如果在国际象棋中多一个车的棋子,那你已经基本胜券在握了。但这些方式在围棋中都行不通,从人类的角度来看,围棋的棋路过于复杂,电脑很难学会。不过AlphaGo做到了,它拥有世界上首个有效的评估函数系统。

那么DeepMind是如何做到的呢?其实解决这个问题的关键是深度学习和类神经网络技术,有了它们,研究人员就能教AlphaGo下棋。就像Google Photos能帮你从无数图片中找出猫咪一样,其背后是该应用对超大量级的猫咪图片做分析后的结果,这些分析处理甚至细化到了像素级别。而AlphaGo能有如此成绩,则得益于对数百万项围棋数据的学习,包括各种棋路和棋手的比赛。

眼下,AlphaGo还在不断学习,其能力也在不断增强。起初,它还是靠学习套路(策略网络)来预测对手的落子方式,不过随着价值网络训练的深入,AlphaGo已经有了那么点“直觉”,它可以分析出比赛的态势了。在棋局中,AlphaGo已经可以通过快速对各种可能性做分析,提前考虑后面几步的落子和排兵布阵了。其实AlphaGo拥有的各项技术都是相互辅助的,类神经网络可以降低电脑的负载,提高工作效率;套路学习则可以减小其搜索范围,而价值网络则可让它从每次的比赛中总结出自己的经验。


AlphaGo拥有自己的“思考”能力

这一增强版的学习系统让AlphaGo变得更像人类,而不是靠惊人计算能力战胜国际象棋大师的IBM深蓝电脑,毕竟围棋和国际象棋在复杂程度上不属于一个量级,用深蓝电脑的方法是无法在围棋上战胜人类的。在五场比赛的间歇,DeepMind都不会对AlphaGo做调整,因此电脑只能靠自己来学习,但每天一场比赛的量确实有些少。此外,DeepMind公司创始人杰米斯•哈萨比斯(Demis Hassabis)称AlphaGo的计算能力在去年十月的比赛后一直都没有得到增强,因此现在它的能力已经达到现有硬件条件下的顶峰。

编辑:薛晓钰

关键词:AlphaGo 李世石 尾气

更多

更多