毕业论文
您现在的位置: 游戏在线 >> 游戏在线介绍 >> 正文 >> 正文

谷歌AIAlphaStar血虐人类玩

来源:游戏在线 时间:2022/10/25
北京白癜风治疗的医院哪家好 https://yyk.39.net/bj/zhuanke/89ac7.html

还记得战胜世界顶级围棋高手的AlphaGo吗?现在,AlphaStar又来了。

谷歌旗下,开发出AlphaGo的人工智能前沿公司,DeepMind官方博客今天宣布其开发的人工智能已经解锁新成就--在暴雪娱乐游戏《星际争霸II》中称霸。这家隶属于谷歌的人工智能实验室开发出了升级版AlphaStar,拥有更加复杂的算法,在这款实时策略游戏上已经达到登峰造极的大师级别,可以击败99.8%的人类玩家。相关研究结果发表在科学杂志《Nature》上。

年初,由DeepMind构建的另一算法AlphaStar以总比分2:0分别战胜《星际争霸Ⅱ》的顶级人类选手MaNa和TLO。这或许是自年AlphaGo在围棋上战胜人类后,再次让人类刷新AI认知的人机大战。

不同于围棋,《星际争霸Ⅱ》是一款即时战略而非回合制的游戏,玩家的信息隐蔽性和移动自由性较围棋更高。之后,Deepmind设立了更宏伟的目标:在不设限制的情况下,以Grandmaster级别玩一场完整游戏。AlphaStar天梯排名达到所有活跃玩家的前0.15%(在九万名玩家中相当于前名以内)。这样的水准直接参加星际2天梯比赛可谓是“炸鱼”般的存在。

Deepmind称,使用通用的机器学习技术(包括神经网络,通过自己与自己游戏进行强化学习,多智能体学习和模仿学习)。从《自然》杂志中发表的论文可以看到,AlphaStar在Battle.net平台上排名高于99.8%的活跃玩家,并且在星际争霸II的神族、人族和虫族都达到了宗师级水平。

学习人的策略,并确保智能体在整个游戏过程中不断学习这些策略,这是提升AlphaStar能力的关键。为此,Deepmind使用了模仿学习,再加上基于语言建模的高级神经网络的体系结构和技术,来制定初始策略,使智能体把游戏玩得比84%的活跃玩家更好。

另外deepmind还使用了一个潜在变量,该变量确定了策略并对人类游戏的开局动作分布进行编码,这有助于保留一些开局的高级策略。

然后,AlphaStar在整个自我游戏过程中使用一种distillation手段,这种方法使AlphaStar可以在单个神经网络中展现许多策略(每个种族一个)。在评估过程中,神经网络不以任何特定的开局动作为条件。

总体而言,Deepmind称,用于开发AlphaStar的技术将有助于进一步提高AI系统的安全性并且可能有助于推进在现实世界中的研究。比如,五角大楼中负责开发商业技术的国防创新部主任MichaelBrown表示,利用AI实现“战略推理”是他们的重点研究方向之一。

从AlphaGo跟李世石围棋博弈技惊四座,到最新出现的AlphaStar,包括GoogleHome、谷歌助理和云计算硬件等,谷歌正式确立了以人工智能优先的公司战略。AI业务涵盖了从硬件到软件、搜索算法、翻译、语音和图像识别、无人车技术以及医疗药品研究等方面。这些业务充分展示了谷歌不断在人工智能(ArtificialIntelligence)里的机器学习(MachineLearning)以及自然语言处理(NaturalLanguageProcessing,NLP)上的精益求精。

转载请注明:http://www.0431gb208.com/sjszlfa/2189.html