毕业论文
您现在的位置: 游戏在线 >> 游戏在线市场 >> 正文 >> 正文

揭DeepMind的前世今生攻陷围棋堡垒

来源:游戏在线 时间:2022/10/25

本文字数:|预计3分钟读完

文|本刊记者沈玉姗

凭借AlphaGo名声大噪的的DeepMind近期又有新动作。

DeepMind与知名游戏公司暴雪联合发布针对《星际争霸2》的AI训练平台SC2LE,并为此提供开源完善的研发环境,帮助研究人员在这款经典热门游戏上进行AI相关的研发测试。

在围棋界击败一众高手后,DeepMind这是不甘寂寞,欲在游戏世界中再度将人类斩落马下?

实际上,这家外界眼中的神秘公司在游戏竞技圈里打转已经不是一两天了。从雅达利(电子游戏第二世代主机)、围棋到星际争霸,在相当长的一段时间里,DeepMind对外公布的研发成果都可以归结为:如何让机器快速掌握游戏通关奥秘。

不过,联合创始人、CEO戴密斯·哈萨比斯(DemisHassabis)多次表示,DeepMind的终极目标是研究出“通用型”人工智能。

在尚无商业化成果的情况下被谷歌高价收购,并在此后几年间成长为全球耀眼的AI明星——搜索巨擎为何对这家位于英国伦敦的研究型初创公司青眼有加,从小被称为“神童”的哈萨比斯,人生小目标究竟是改变世界,还是毁灭人类?

游戏少年进击

DeepMind的办公地点位于伦敦国王十字大学城的一处普通楼房里,从外表看并没有什么特别之处。

不过,核心创始人哈萨比斯的过往经历却称得上传奇:4岁开始下国际象棋,13岁赢得国际象棋大师头衔,16岁进入剑桥大学计算机科学专业,17岁跟随著名游戏设计师PeterMolyneux完成经典游戏《主题公园》(ThemePark)的开发工作。年,年仅22岁的哈比萨斯就成立了自己的游戏公司。

不久,以天才游戏少年形象示人的哈萨比斯又给自己添加了一个新身份:伦敦大学学院(UCL)攻读认知神经科学博士。

年,从小就对脑科学感兴趣的哈萨比斯重返校园,并开创性地发现健忘症患者系脑部海马体受损导致规划未来事件发生困难,在年被顶级学术期刊《科学》评为“年度突破”。

年,哈萨比斯与在UCL结识的研究员博士ShaneLegg,以及儿时伙伴、19岁从牛津大学辍学创业的MustafaSuleyman,三人共同成立了DeepMind,旨在将机器学习和系统神经科学的最先进技术结合起来,建立强大的通用学习算法。游戏开发者和神经科学家——哈萨比斯看似风马牛不相及的两段经历至此也终于合二为一。

在保持一段时期的低调后,DeepMind开始了疯狂的游戏晋级之路。年12月,在美国太浩湖举行的一次机器学习研究大会上,DeepMind首次向外界演示了其研发的软件在太空入侵者、乒乓球等雅达利游戏中超越人类的表现。

正如后来的AlphaGo,这一次演示震惊了在场的专家,因为当时没有机器能从零开始学习规则,并掌握如此复杂程度的游戏,不少研究人员对此困惑不已。

人们猜测,在深度学习和增强学习等技术以外,DeepMind还可能借鉴了哈萨比斯在海马体上的研究成果,因为机器学习游戏玩法的过程需要牵涉到不断回顾过往经历,并给出未来怎么做的精确提示。

年1月,演示后仅仅一个月,谷歌就宣布以6.5亿美金完成对DeepMind的收购,谷歌创始人拉里·佩奇将DeepMind的技术称为“我长久以来见过最令人兴奋的事件之一”。

事实上,游戏一直以来都被视为人工智能算法研究的理想试验田:高水平游戏的数据极多,有充足的训练样本;游戏目标清晰,有助于提出问题,且问题足够复杂。

比如,围棋是“完全信息博弈”游戏中最复杂的一项,理论上能够推理出确定的高胜率选点;而星际争霸的玩家则从各自基地开始发展,初期看不见对方的动作,对战策略由多方面因素决定,属于典型的“非完全信息博弈”。

年11月,DeepMind宣布与暴雪娱乐合作,共同开发用于《星际争霸2》的人工智能训练环境。在今年5月的乌镇围棋峰会上,哈萨比斯表示,星际争霸将成为AI进步的下一个大考。

大举“入侵”医疗

DeepMind被收购初期,有传谷歌一度想将其并入搜索业务,承担信息挖掘等任务,这笔收购也确实为谷歌带来了开源节流的效果。

去年7月,DeepMind宣布其研发的学习软件已将冷却谷歌数据中心的电力减少了2/5,可在数年内为谷歌节省数亿美元成本。

不过,多年来坚持独立发展的DeepMind显然不止于此,这也是创始人哈萨比斯于年关掉游戏公司、转而投身神经科学的原因:“DeepMind的目标不仅仅是获得游戏胜利,还要从中获得乐趣和启发。但从个人角度来说,我喜欢玩游戏,我也曾开发过电脑游戏,但最终我们希望能将技术应用于解决现实世界的难题。”

在其认为“陷入困境”的多个领域里,DeepMind首先将火力对准了本国医疗——英国国家医疗服务体系(NHS),并与其下属的多个组织机构达成了一系列合作:

年,DeepMind与英国皇家自由信托基金会首度达成数据分享合作,获权处理基金会下属3家医院每年共计万名病人的就诊记录,不久后开发出名为Streams的实施健康监测APP,帮助医生追踪病人的血检数据,以及时诊断出急性肾损伤(AKI)的早期症状。

年7月,医院宣布,将通过NHS向DeepMind提供万份的眼球扫描资料,后者用来对机器学习算法进行训练,以帮助人工智能更好学习糖尿病视网膜病变等眼疾的早期症状。糖尿病人的失明概率高出常人25倍,及早发现病变可以预防98%的严重视力损伤发生。

8月,基于位匿名病患的CT和MRI图像,DeepMind与医院共同研究让机器学会区分健康组织和癌组织,简化医生治疗头颈部癌症的化疗时间。

11月,DeepMind再次与英国皇家自由信托基金会签订用于打造Streams应用的5年合约,计划将Streams的预警范围从肾功能扩大到了其他重大疾病。DeepMind与NHS都未披露具体数字,不过Streams医院部署。联合创始人MustafaSuleyman当时向媒体透露,DeepMind已经开始从医疗业务中获利。

尽管DeepMind“入侵”NHS体系数据的做法在英国国内饱受争议,其在年与NHS的首度合作甚至于近期被监管部门信息专员办公室(ICO)判为违规,DeepMind方面仍然坚称,是“怀着最大的善意进入健康领域”。

由于NHS的大多数服务免费向公民提供,而近年来英国政府财政不堪重负,以人工智能提升医疗服务效果、降低开支的做法是创新,也是无奈之举。

转载请注明:http://www.0431gb208.com/sjszlff/2202.html

  • 上一篇文章:
  • 下一篇文章: 没有了