AD
首页 > 头条 > 正文

围棋人机大战:最后较量开始 柯洁能否扳回一局?-科技频道-金鱼财经网

[2021-02-25 15:58:10] 来源: 编辑:wangjia 点击量:
评论 点击收藏
导读: 在为期5天的“中国乌镇·围棋峰会”中,中国棋手世界排名第一的柯洁与AlphaGo人工智能展开人机大战,三番棋首局较量在23日打响,第一局柯洁以四分之一子惜败AlphaGo,25日举行的第二局比赛则因

在为期5天的“中国乌镇·围棋峰会”中,中国棋手世界排名第一的柯洁与AlphaGo人工智能展开人机大战,三番棋首局较量在23日打响,第一局柯洁以四分之一子惜败AlphaGo,25日举行的第二局比赛则因柯洁盘中认输提前1个多小时结束,大比分2:0。最后一局在27日上午10:30拉开帷幕。

下图为最新进展,AlphaGo执黑子,柯洁执白子。

(图片来自直播视频)
(图片来自直播视频)

第二局过后,柯洁称AlphaGo 2.0接近上帝,自己中途以为很接近胜利,但因为太紧张“后面又下了一些不好的棋”。“棋圣”聂卫平则评价称,“柯洁想赢估计只能靠找到bug,或者我们派小鱼儿去拔个电源什么的。”

除了连续两局战胜柯洁,AlphaGo还在团队赛中虐了一把人类。在周五举行的团队赛中,由陈耀烨、时越、芈昱廷、唐韦星、周睿羊组成的队伍遭 AlphaGo “团灭”。人类在开局阶段落后太多,尽管在收官阶段频频放出好手,但因前期差距始终不能弥补,最终仍没能抵挡住 AlphaGo,国手团队 254 手投子认输。

Alpha Go 2.0的自我学习 远强于初代的深度学习

全天候科技日前指出,AlphaGo初代使用的是深度学习,需用数据训练机器人。但AlphaGo 2.0则可自我学习,能从自己跟自己的对弈中提升。二者的差别相当于顶级大师和职业玩家中层水平的差距,所以柯洁才说“第一场不是我输了1/4子,而是机器只想赢我1/4子。”

此次的柯洁对战AlphaGo和去年李世石对战的Alpha Go有什么区别呢?首先,与李世石对战的AlphaGo初代使用的是深度学习法,通过不断的图谱和各类棋局的陪练,使得AlphaGo不断的获得数据,具备对抗各类局势的能力。说白了,就是用数据来训练机器人,要知道AlphaGo训练时使用了超过16万个人类棋谱,在加上其建立在数据的基础上,又通过与自身的对战完成了3000万个棋谱的对决,最终得到了几万个模式用来对抗人类高手。

但是,AlphaGo 2.0则可以完全摒弃人类的棋谱,通过设定规则后允许人工智能程序从0开始,不需要依托任何外来数据和各种人类棋谱,就是凭借自身内部的不断对弈,然后发掘各类棋路和变数,从在不断的攻守之间推导出各类对决的方案和方法。简单来说,就是不接受任何人类围棋经验,只需要知道规则,然后就自己跟自己对战,从对战的博弈不断学习和提升。

围棋AI:人工智能发展的缩影

广发证券(000776,股吧)分析师张超在报告中指出,围棋AI的迅速发展是近年人工智能突破性一个缩影。后者突飞猛进的原因主要有以下几点:算法的突破、数据的增长、硬件的发展和开源软件的流行。

广发张超进一步指出,深度增强学习是AlphaGo的核心技术:

围棋AI的决策是一个增强学习的过程。当前的棋局是状态,能否赢棋是奖赏,策略就是根据状态走子的决策方法。AlphaGo通过两个深层神经网络解决了价值函数的估计和策略的计算,就是策略网络和价值网络。通过价值网络与策略网络相结合的方式,AlphaGo摆脱了穷举法的庞大计算量;通过大量的训练,ALphaGo迅速成长,最终站到了围棋人工智能的最高点。

围棋人机大战:最后较量开始 柯洁能否扳回一局?

查看更多:

为您推荐