围棋人机大战：最后较量开始柯洁能否扳回一局？-科技频道-金鱼财经网

[2021-02-25 15:58:10] 来源：编辑：wangjia 点击量：

评论 点击收藏

导读： 在为期5天的“中国乌镇·围棋峰会”中，中国棋手世界排名第一的柯洁与AlphaGo人工智能展开人机大战，三番棋首局较量在23日打响，第一局柯洁以四分之一子惜败AlphaGo，25日举行的第二局比赛则因

在为期5天的“中国乌镇·围棋峰会”中，中国棋手世界排名第一的柯洁与AlphaGo人工智能展开人机大战，三番棋首局较量在23日打响，第一局柯洁以四分之一子惜败AlphaGo，25日举行的第二局比赛则因柯洁盘中认输提前1个多小时结束，大比分2:0。最后一局在27日上午10:30拉开帷幕。

下图为最新进展，AlphaGo执黑子，柯洁执白子。

（图片来自直播视频）

第二局过后，柯洁称AlphaGo 2.0接近上帝，自己中途以为很接近胜利，但因为太紧张“后面又下了一些不好的棋”。“棋圣”聂卫平则评价称，“柯洁想赢估计只能靠找到bug，或者我们派小鱼儿去拔个电源什么的。”

除了连续两局战胜柯洁，AlphaGo还在团队赛中虐了一把人类。在周五举行的团队赛中，由陈耀烨、时越、芈昱廷、唐韦星、周睿羊组成的队伍遭 AlphaGo “团灭”。人类在开局阶段落后太多，尽管在收官阶段频频放出好手，但因前期差距始终不能弥补，最终仍没能抵挡住 AlphaGo，国手团队 254 手投子认输。

Alpha Go 2.0的自我学习远强于初代的深度学习

全天候科技日前指出，AlphaGo初代使用的是深度学习，需用数据训练机器人。但AlphaGo 2.0则可自我学习，能从自己跟自己的对弈中提升。二者的差别相当于顶级大师和职业玩家中层水平的差距，所以柯洁才说“第一场不是我输了1/4子，而是机器只想赢我1/4子。”

此次的柯洁对战AlphaGo和去年李世石对战的Alpha Go有什么区别呢？首先，与李世石对战的AlphaGo初代使用的是深度学习法，通过不断的图谱和各类棋局的陪练，使得AlphaGo不断的获得数据，具备对抗各类局势的能力。说白了，就是用数据来训练机器人，要知道AlphaGo训练时使用了超过16万个人类棋谱，在加上其建立在数据的基础上，又通过与自身的对战完成了3000万个棋谱的对决，最终得到了几万个模式用来对抗人类高手。

但是，AlphaGo 2.0则可以完全摒弃人类的棋谱，通过设定规则后允许人工智能程序从0开始，不需要依托任何外来数据和各种人类棋谱，就是凭借自身内部的不断对弈，然后发掘各类棋路和变数，从在不断的攻守之间推导出各类对决的方案和方法。简单来说，就是不接受任何人类围棋经验，只需要知道规则，然后就自己跟自己对战，从对战的博弈不断学习和提升。

围棋AI：人工智能发展的缩影

广发证券(000776,股吧)分析师张超在报告中指出，围棋AI的迅速发展是近年人工智能突破性一个缩影。后者突飞猛进的原因主要有以下几点：算法的突破、数据的增长、硬件的发展和开源软件的流行。

广发张超进一步指出，深度增强学习是AlphaGo的核心技术：

围棋AI的决策是一个增强学习的过程。当前的棋局是状态，能否赢棋是奖赏，策略就是根据状态走子的决策方法。AlphaGo通过两个深层神经网络解决了价值函数的估计和策略的计算，就是策略网络和价值网络。通过价值网络与策略网络相结合的方式，AlphaGo摆脱了穷举法的庞大计算量；通过大量的训练，ALphaGo迅速成长，最终站到了围棋人工智能的最高点。

围棋人机大战：最后较量开始柯洁能否扳回一局？