AlphaGo谢幕之刻到来 是多么寂寞
- 来源:物联网智库
- 2017/12/19 14:02:2739231
【中国安防展览网 科技动态】任何一个围观过李世石与谷歌围棋AlphaGo人机“世纪大战”的人,可能都不会对下图感到陌生。
那位坐在李世石对面代替AlphaGo落子的眼镜男,并非普通的工作人员,而是AlphaGo的核心作者之——Aja Huang (黄士杰),同时也是DeepMind近20人团队中一位围棋高手。在电脑面前,他亲手编写出了AlphaGo的程序;在电脑之外,他又手起子落,成为AlphaGo的“人肉臂”,与李世石当面对弈。
黄士杰和AlphaGo一起走过了一段光辉的历程,如今,也到了谢幕之刻。凌晨,黄士杰在Facebook上发帖宣布,他本人将正式从AlphaGo团队离开,转到DeepMind其他项目的研究中去。其实也间接宣布了AlphaGo项目的正式结束。
的谢幕!早在今年5月战胜世界围棋人柯洁后,DeepMind就曾宣布,从今往后AlphaGo项目将不会再继续开发,AlphaGo也不会再参加竞技比赛了。
不过在AlphaGo正式退役前,谷歌DeepMind还将做以下几件事:1.公布50盘AlphaGo自我对弈棋谱,其中包含许多全新的思路及策略;2.发表后一篇跟AlphaGo有关的论文;3.上线一款基于AlphaGo的围棋教学软件AlphaGo Teach。
随后,DeepMind一一兑现了承诺。
件事:5月28日,中国围棋峰会在浙江落幕,赛后Deepmind就在公布了50盘AlphaGo自我对战的慢棋棋局。
第二件事:10月19日,Deepmind在Nature上发布了名为《Mastering the game of Go without human knowledge》(不使用人类知识掌握围棋)的论文,展示了他们更强大的新版本围棋程序“AlphaGo Zero”
第三件事:就在两天前的12月11日,黄士杰在朋友圈里公布,AlphaGo教学工具上线了,任何人都可以登陆AlphaGo Teach,和聂卫平口中“围棋20段”的阿老师一起学习。
目前看来,这三件事情都已经全部完成,AlphaGo项目迎来谢幕!是多么寂寞!周星驰的电影让一句略带调侃的“是多么寂寞”火遍大江南北,但是把这句话安在AlphaGo“家族”身上,却丝毫不显突兀。
我们来看一下AlphaGo“家族”的辉煌战绩:
1.击败樊麾
2015年10月,AlphaGo击败樊麾,成为个无需让子即可在19路棋盘上击败围棋职业棋手的电脑围棋程序,写下了历史,相关成果在2016年1月发表于Nature
2.击败李世石
2016年3月,AlphaGo在一场五番棋比赛中4:1击败职业棋手李世石,成为个不借助让子而击败围棋职业九段棋手的电脑围棋程序,再创历史。五局赛后韩国棋院授予AlphaGo有史以来位名誉职业九段
3.排名短暂超越柯洁
2016年7月18日,AlphaGo在Go Ratings网站的排名升至世界。但几天之后被柯洁反超。
4.Alpha Go化名“Master” 60连胜
2016年的倒数第三天,一个用户名为“Master”的围棋用户,连续在围棋平台大开杀戒,“斩杀”包括柯洁、朴廷桓、井山裕太、陈耀烨、申真谞、常昊、古力等各路围棋高手,终以以60连胜告终。柯洁连输三场,期间还因为急性肠胃炎住院……在第59场时候,“Master”自报家门:“我是AlphaGo的黄博士”。
5.AlphaGo大败柯洁,柯洁落泪哽咽
2017年5月27日,乌镇围棋峰会,柯洁总比分 0:3 败于AlphaGo。比赛中,柯洁在局面不利时长时间离开,回来后又泪洒现场。赛后柯洁一度哽咽称:它太我很痛苦,看不到任何胜利的希望。
6.AlphaGo Zero横空出世 自学21天虐Master
2017年10月,DeepMind新版AlphaGo论文介绍了迄今强新的版本AlphaGo Zero:使用纯强化学习,将价值网络和策略网络整合为一个架构,3天训练后就以100比0击败了上一版本的AlphaGo。
7.AlphaZero的增强学习算法横扫所有棋类
2017年12月7日,DeepMind团队在发布的一篇论文中提到了一项名为AlphaZero的增强学习算法,能够在不改变算法的前提下,同时在围棋、象棋、日本将棋上达到世界水平。
可以说,此后人类在围棋上打赢AI的可能性已经接近0,AlphaGo即便再怎么发展,能够进一步达到的突破已经很有限了。因此,AlphaGo项目开始陆续关停,该发论文发论文,该发教学工具发教学工具。
DeepMind的下一步?
虽然AlphaGo项目即将退役,但是DeepMind却还有着更光明、更广阔的未来。在今年5月宣布AlphaGo即将退役时,DeepMind也初步披露了AlphaGo团队的下一步计划――研发出应用领域更广泛的算法,包括找到新的疾病治疗方法、显著降低能源消耗、发明革命性的新材料等。
星际争霸
早在2016年3月AlphaGo挑战围棋成功之后,就传出DeepMind团队的下一步计划——在游戏《星际争霸2》上打败人类。
人工智能研究算法很喜欢用计算机游戏。一是研究目标清楚,游戏目标定义得很完善,科研有时重要的是提出问题。二是近流行的深度学习需要极多的训练样本,人类的线上高水平比赛很多能够提供足够的样本。三是问题足够难,进展如何通过人机对战、线上测试一清二楚,而不是研究者自说自话。
围棋是“完全信息博弈”(局面摆明,理论上有确定结论)游戏里复杂的一个,又很有艺术性。在围棋上战胜人类,就实现了Deepmind负责人哈萨比斯的说法,机器自我对弈不断自我学习的方法可以解决一切基于推理的棋类游戏。
这个自学习的框架,能否在“非完全信息博弈”上打败人类,令人非常有兴趣,同时又极有学术价值。星际争霸是一个很合适的测试对象。星际争霸常见的是两个玩家对战,各自从一个基地开始发展,没有兵力在附近就看不见对方的动作,对方在干什么自己不知道,因此是“非完全信息博弈”。
不过到目前为止,人工智能对《星际争霸》的探索还处在非常早期的阶段,不仅需要训练各种“常识”,而且在面临突发情况时的应变能力也有所不足。
医疗
DeepMind已经与英国国家医疗服务体系(National Health Service)达成合作,并启动“深度思维健康”(DeepMind Health)项目。该项目意图通过专业的技术支持来帮助临床医生,为他们的病人提供尽可能好的医疗服务:1.帮助医生监测急性肾损伤病症;2.使用机器学习技术帮助医生判断患者的视力情况。此外,DeepMind团队还推出了血液测试的AKI报警平台Streams。
11月27日,黄士杰还在Facebook转发了一则关于DeepMind将与一些的研究机构共同投入诊断乳腺癌的AI研究消息。DeepMind将利用新的机器学习技术,希望能够快速、准确地检测出癌症的迹象,帮助医生尽早发现癌症,以便更早的有效治疗。
能源
在节能方面,DeepMind还与谷歌的数据中心团队合作,运用类似AlphaGo的技术开发了了管理制冷系统的新方法,使建筑节能到达了15%。如果把这些技术应用在其他更大型的工业系统上,就会节省更多的能源开支。
所以,的AlphaGo已经退休,但他背后的技术永存,并将可能在未来造福更多的人类。别了,AlphaGo!感谢所有曾经为这项伟大的技术付出努力之人!(原标题:再见,AlphaGo!是多么寂寞!)