本篇文章3097字,读完约8分钟
[谷歌首先用go职业玩家的3000万步训练alphago的“价值网络”,直到网络对人类活动的预测准确率达到57%(AlphaGo之前的记录是44%)。]
谁将赢得李世石和阿尔法戈之间的第一盘棋?
一方是拥有十个以上围棋世界冠军头衔的最高级别人类玩家;一个是目前人工智能领域最强大的围棋程序。北京时间今天(3月9日)12点,全世界将聚焦首尔。
“这是一个全新的、陌生的游戏,也是一个全新的挑战。我很难保证5-0的胜利。毕竟,我的对手从不犯错。”在昨天的赛前新闻发布会上,虽然李石师改变了他以前的自信,但他仍然相信“目前人类比人工智能更强”。
去年10月,欧洲围棋冠军范辉输给了阿尔法围棋,但在研究了棋谱后,许多围棋大师指出他涉嫌“放水”。在这方面,正如alphago的设计者、谷歌(Google)人工智能公司deepmind的首席执行官杰米哈萨比斯(Jamie Hassabis)在新闻发布会上所说的那样:“你看到的alphago并不是它的全部能力,它目前仍在用人工智能技术学习棋谱。”我相信阿尔法戈可以在游戏中展现出不同的一面。”
在接受《中国商报》记者的独家采访时,曾在韩国科技学院担任人工智能院士、现供职于韩国顶级私人研究机构handysoftware的李承浩博士表示,无论这场对抗中谁赢谁输,最终的赢家都将是人类自己。
走向世界:人们一定会赢
至于人机战争结局的预测,中国和朝鲜围棋界都站在人类一边。
3月7日晚,象棋圣聂卫平对包括《中国商报》在内的媒体表示,人工智能缺乏判断力,很难在与人类的比赛中获胜。
“很多职业球员,包括顶级职业球员,都有很多不同的看法。例如,李世石认为情况还可以,而柯杰可能认为不可以。围棋的判断对电脑来说是个大问题。我不相信计算机现在能突破这一点,所以在人和计算机的作用下,100%的人都会赢。”聂卫平说道。
聂卫平的依据是围棋的变化可以归结为361的阶乘,361本身就是一个无穷大的数。它还包括各种各样的技术,如二对一、三对一、打结和向后投掷,可以说是无穷无尽的变化。
"李世石最近状态很好."同一天,中国围棋手柯杰说。言下之意是,目前的人工智能不足以挑战现役的一流围棋选手。
此前,柯杰曾多次击败李世石,最近还接受了国内一家异构智能公司——Go ai的挑战。但他没有反抗。
韩国女棋手尹英敏也站在李世石一边。素有“韩国围棋推广第一人”之称的她昨日对本报记者表示:“按照双方的水平,李世石九段不仅会赢,而且还会以压倒性优势取胜。如果李世石输了一局,将被认为是重大失误。”
“但我们需要注意的是,本次竞赛的竞赛设计对alphago有利。”尹英民补充道。
据了解,人机大战将分五场进行,分别安排在9日、10日、12日、13日和15日,比赛将在韩国时间下午1点(北京时间下午12点)开始。尹应民认为:“在这样仓促的日程安排下,人的疲劳会上升,但电脑不会疲劳。”
第二,每边有2小时的布局时间和3次60秒的倒计时时间(玩家使用后会限制倒计时时间)。据估计,每场比赛将需要4~5个小时。"充足的时间为计算器操作提供了有利条件."尹英民说,阿尔法围棋的另一个优势是,这款游戏使用的是中国围棋的比赛规则(比赛结束后,棋手们会把目光投向对方),这是阿尔法围棋在“训练”中经常使用的规则,而李石士则更熟悉韩国的规则。此外,还有一句中国谚语,“了解自己,了解自己,打好每一场仗。”现在阿尔法戈一定很了解李诗诗,而李诗诗对阿尔法戈一无所知,这对李诗诗来说是不利的。
不过,尹英民也表示,阿尔法戈的优势能否影响战局,仍取决于李世石当天的身心状态。
it行业有不同的意见
作为一名人工智能专家,李承浩同意近60%的韩国人的观点:李石狮将获得压倒性优势。他认为,即使机器人有它们独特的优势,它们仍然不能对状态良好的李石师构成巨大的威胁。他笑着说:“毕竟,顶级职业球员很少,而且在连续几场比赛中都有致命的失误,除非他不愿意继续对抗。”
创新工场首席执行官、谷歌前全球副总裁、大中华区总裁李开复也在智湖会议上表示,阿尔法戈这次不太可能打败李石士,但它一定会在1-2年内打败人类。
李开复指出,魏凡只是这一职业的第二部分,而李世石则是这一职业的第九部分。差别是巨大的。“例如,如果一个人在乒乓球比赛中击败了非洲冠军,并不意味着他能成功地挑战中国冠军。”
与上述观点不同,搜狗首席执行官王小川认为,人工智能将胜出。他提出了自己的两个主张:阿尔法戈将战胜李世石;除了围棋,人工智能将在其他封闭游戏中横扫人类。“我认为谷歌的深度学习方法加上搜索空方法可以涵盖人们的一般思维,而且可能会做得更好。”王小川说。
alphago的研究员David Silva说,alphago系统的关键是将巨大的搜索空压缩到一个可控的范围内。为了实现这个目标,alphago系统将最先进的蒙特卡洛树搜索技术与两个深度神经网络相结合,每个深度神经网络包含许多层,每一层包含与数百万个神经元相同的连接。
在阿尔法戈的两个不同的神经网络中,“策略网络”的作用是预测下一步,并将搜索范围缩小到最有可能触发的步骤;另一个神经网络,“价值网络”,是用来减少搜索树的深度和估计每一步的赢家,而不是搜索所有的方式来结束游戏。
与以前的方法相比,阿尔法戈的搜索方法更加人性化。例如,深蓝使用了一种强大的方法来搜索比阿尔法戈多几千倍的棋子。另一方面,阿尔法戈通过想象游戏的其余部分来预测下一步,并重复多次。在上面的模拟游戏中,策略网络为下一步提出智能建议,而价值网络评估每个经过的位置。
具体来说,谷歌首先用围棋职业玩家的3000万步训练了“价值网络”,直到人类移动预测的准确率达到57%(阿尔法围棋的先前记录是44%)。
但是阿尔法戈的目标是击败最高水平的人类玩家,而不仅仅是模仿他们。为了做到这一点,阿尔法戈学会了自己发现新的策略,并通过在它的两个神经网络之间的数千个游戏中使用被称为强化学习的反复试验的方法来逐步改进它。这种方法提高了“策略网络”的效率,使得最原始的“神经网络”可以用巨大的搜索树打败最先进的围棋软件。
“在与范辉的比赛之后,我们多次更新了阿尔法go。请注意阿尔法戈与最好的选手李世石比赛的方式。”Hasabis昨天预测“在大约五年内,人工智能将完全超越顶尖的人类玩家。”
最终的赢家仍然是人类
无论阿尔法戈还是李世石赢得比赛,这都不是人工智能的最终目标。
李承昊多次向本报记者强调:“人工智能发展的最终方向仍然是依靠和服务于人类。毕竟,人工智能也是由人类创造的。这是人工智能技术发展的基础和最终目标。我们不能忘记这个目标。”
“此外,通过人工智能技术,可以推动物联网等新技术的发展,这更有利于人类的发展和福祉。”李承昊认为,由于人工智能技术,近年来暂时停滞的科学技术发展将带来“新的春天”。
谷歌(Google)董事长埃里克施密特(Eric schmidt)也在赛前新闻发布会上表示:“我们开发人工智能机器人的最终目标是为人类提供利益,为尚未解决的问题提供新的解决方案;其中,围棋只是我们选择的增强人工智能机器人实力的方法之一。不管这场对抗是赢是输,最终的赢家将是人类自己。由于人工智能的发展,最终的受益者将是人类自己。”
事实上,谷歌和百度已经将人工智能技术应用于语音识别、图片识别和无人驾驶。
“当湖边是十场比赛时,它不仅仅是赢。在象棋游戏之外,我们正在探索的新领域是人类智能和机器智能之间的合作。因此,围棋智能只是人工智能的副产品,而人工智能的最终目标是让我们的生活更加便捷。”异质智能首席执行官吴仁表示。
标题:今日全球聚焦 李世石大战AlphaGo
地址:http://www.jt3b.com/jhxw/8815.html