AD
首页 > 头条 > 正文

AlphaGo1:0李世石-科技频道-金鱼财经网

[2021-02-24 01:46:13] 来源: 编辑:wangjia 点击量:
评论 点击收藏
导读: 人类智慧“最后的堡垒”被攻破了吗?3月9日,韩国首尔四季酒店,在一场关乎竞技、算法、人工智能(AI)发展乃至哲学的围棋“人机大战”中,代表人类出战的韩国世界围棋冠军李世石九段不敌谷歌(Google)

人类智慧“最后的堡垒”被攻破了吗?

3月9日,韩国首尔四季酒店,在一场关乎竞技、算法、人工智能(AI)发展乃至哲学的围棋“人机大战”中,代表人类出战的韩国世界围棋冠军李世石九段不敌谷歌(Google)旗下公司DeepMind开发的人工智能系统AlphaGo。这一结果出乎赛前大部分人的预测。

这场对决被视为人工智能时至今日的成果测试。

由于棋盘上变化繁复,“千古不同局”,计算机无法仅通过“蛮力”穷举来取胜,源自中国的围棋向来被视为人机对决的“最后一块棋盘”。许多专家认为计算机要想攻陷人类智慧的这一堡垒至少“再过10年”,然而现实来得比预料的更早更快。

赛后,李世石坦言对AlphaGo的表现感到吃惊。“AlphaGo开局下得非常好,在比赛过程中不断有一些让我想不到的下法。”

北京时间今天(3月10日)中午12点双方将进行第二场比赛。李世石预测自己的胜率是50%。

值得注意的是,“中国职业围棋第一人”柯洁九段在首场比赛过程中就推翻了自己赛前的预测。此前柯洁表示看好李世石5:0赢AlphaGo,但现在柯洁认为AlphaGo可能以5:0赢李世石。柯洁是新一代的中国围棋棋手的领军人物,曾八次击败李世石。

感受不到对手呼吸气场

人工智能的里程碑之一是IBM的超级电脑“深蓝”在1997年击败当时的国际象棋冠军卡斯帕罗夫。“国际象棋每步大约会出现35种左右的走位可能,而围棋的走位可能则高达250种,每一步250种相乘就意味着整局比赛会出现多到几乎无穷尽的走位方案。”DeepMind总裁哈萨比斯说。换句话说,在人们发明出量子计算机之前,现有的人工智能水平还无法预测出围棋比赛时的所有可能。这意味着电脑必须要有类似人类的“直觉”才能在比赛中占上风。

去年10月,AlphaGo以5:0的战绩横扫欧洲围棋冠军樊麾。这是人工智能程序首次在不让子的情况下战胜人类围棋选手。不过,樊麾显然不能代表人类棋手最高水平。AlphaGo所属公司向李世石发出邀约,他是过去十年获得围棋冠军头衔最多的人。

事实上,大多数围棋界人士赛前都看好李世石能够拿下比赛,他们唯一的担心只是在短短数月中AlphaGo的自我学习能力可以达到多么恐怖的层次。

创新工场CEO、曾经研发过棋类对弈软件的李开复也透露,按照李世石与AlphaGo的Elo(围棋等级分),可以算出去年年底的AlphaGo打败李世石的概率相当低。

“如果对弈一盘,AlphaGo尚有11%的获胜的可能性,而整个比赛五盘胜出三盘或更多,AlphaGo就只有1.1%的可能性了。”李开复强调这个预测是根据AlphaGo几个月前的表现做出的,“但是无法猜测它如今的进步能力。”

赛前发布会上,谷歌执行董事长艾瑞克·施密特对比赛只是官方表态式地说道:“输赢都是人类的胜利。”不过,正在韩国观战的中国围棋队总教练俞斌透露,他们得到的谷歌内部消息说“李世石胜出的可能性为0”。

李世石与AlphaGo的第一场人机大战于北京时间9日12时正式开始,李世石执黑子,谷歌AlphaGo执白子。整场3个多小时的对弈中,李世石一开始占上风,但在最后的20分钟,AlphaGo取得无懈可击的领先,李世石只能将胜利拱手让“机”。

投子认负后,李世石独自一人在现场默默复盘。

“与机器对战和与人对战是很不一样的。”李世石对BBC说,“与人对战时,你通常能感觉到对手的呼吸、气场。而在许多时候你是依据对手的身体动态来做下一步决定。”

“和机器对战,你就不能这么做。”他说。

决定胜负的关键可能还是心态。一些棋界专家认为,电脑显然没有心态起伏,在第一盘获胜后也不会因此骄傲轻敌;但首轮失利可能会给李世石带来巨大压力,从而影响他后面几盘的发挥。

这次比赛在韩国、中国、日本同时直播,比赛采用中国规则,执黑一方贴7目半,各方用时为两小时,3次60秒的读秒。即使一方率先取得3胜,也会下满5盘。

人工智能取得惊人成就

在人工智能领域的科学家看来,AlphaGo并不需要拿下整场比赛,甚至在5盘中拿下1盘其实就取得了胜利。

英国《卫报》称,帝国理工学院认知机器人学教授穆雷·沙那罕认为在AlphaGo战胜樊麾后,已经说明了“AI在发展中达到了一个重要的里程碑”,而只要战胜李世石这位顶尖棋手一盘,就证明“人工智能已经取得了惊人的成就,它可以在短时间里不断学习,变得更加强大” 。

德国人工智能研究中心的安德烈亚斯·登格尔说,这些进步可能意味着人工智能正在走向快速发展的时代,或能引领新一轮产业创新与变革的到来。

事实上,随着人工智能技术进步,人类屡屡在对抗中败阵。

1997年,美国IBM公司超级计算机“深蓝”依仗强大的计算能力,战胜当时世界排名第一的国际象棋大师卡斯帕罗夫;2006年,中国超算“浪潮天梭”同时对战5位中国象棋特级大师,最终以总比分险胜,取胜关键被认为是不知疲倦的稳定性和超强计算能力;2011年,“深蓝”的同门师弟“沃森”在美国老牌智力问答节目《危险边缘》(《Jeopardy!》)中轻松战胜了两位传奇冠军。“沃森”可以在3秒内检索数百万条信息并以人类语言输出答案,分析题目线索中的微妙含义、讽刺口吻及谜语等;还能根据比赛奖金的数额、自己比对手落后或领先的情况、自己擅长的题目领域来选择是否要抢答某一个问题。

AlphaGo的强大则在于模拟人类大脑的神经元结构,如何结合深度学习与强化学习两套神经网络,简单来说,一方面它迅速汲取10万围棋高手的棋局,充分利用人类棋手的既有经验;另一方面是“左右互搏”,每天跟自己下上几十万盘,在不断的试错中自我完善、自我进化,并累积3000万棋位的数据库。

“当学习完普遍模式后,他从观看职业比赛中学习到合理的标准,然后就开始自己下,通过上百万次不同的下法,他累积经验,一次比一次更好,他从错误中学习。”DeepMind的总裁德米什·哈萨比斯说。从经验中自我学习与进步,意味着这个超级电脑正时刻变得更强大。

机器写不出《相对论》

与“人机大战”一样火爆的话题是,AlphaGo赢下比赛能否证明人工智能已经超越人类?

复旦大学哲学学院教授、人工智能哲学专家徐英瑾在接受采访时指出,即便李世石输掉比赛,也并不意味着人工智能已比人类聪明。

徐英瑾举了个例子,AlphaGo是训练了2000万局棋后,才能战胜职业围棋选手,而一个人在成长为职业九段高手前,训练的棋局数量远小于2000万。

“尽管拥有了深度学习能力,但它胜过人类的主要原因仍和以前的计算机程序一样:运算速度快、不受生物属性限制。”

而从与李世石的第一盘比赛来看,AlphaGo就像李世石说的那样,“过分拘泥于局部价值,欠缺整体的完善感。”也就是说,尚欠大局观,这也与它自我学习的方式有关。

曼彻斯特大学的计算机科学教授凯文·柯伦在接受《果壳》采访时也表示:“人类能够辨认并区分现实世界中的事物、明确地理解对话内容,并且基本能在现实生活中长期维持运作而不‘出错’。但最优秀的AI也只能在理想的应用情境中实现以上功能的一部分。”

正如AlphaGo的开发者哈萨比斯所言,“最终,我们想要将这套技术应用到真实世界的重要问题中,比如用于个人助理软件,这样的个人助理软件能够从用户在线行为中学习用户偏好,并对产品和事件做出符合直觉的建议。”

更何况,机器有智力、缺智慧的问题依然未解决,与人类相比,它看不懂莎士比亚,当不了莫扎特,也写不出《相对论》。因此,在围棋上挑战了人类智力,也仅是人工智能在某一类别智力发展上的里程碑。

工作原理

AlphaGo的主要工作原理是“深度学习”。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起形成神经网络“大脑”进行精准复杂的处理,就像人们识别物体标注图片一样。

具体来说,AlphaGo的开发团队在程序中输入职业棋手的3000万种下法让其学习,并使其达到能够以57%的概率预测与其对阵人类的水平。在此基础上,人工智能将自己的对战重温数百万次,在不断积累胜负经验的过程中,掌握取胜方式。在观察围棋子的整体布局的基础上选择最佳下法,这一方式十分接近于带着直觉和第六感作出判断的人类大脑功能。

查看更多:

为您推荐