你了解人工智能吗 击败DOTA2选手的AI只学习了两周
2023-06-11 02:52:59 小编:琉璃业业 我要评论
昨天8月13日,西雅图钥匙体育馆内,由特斯拉 CEO 马斯克投资的人工智能研究机构 Open AI 研发的 Dota2 AI 首次公开亮相,对阵世界顶级选手Dendi。(点我)
Dota2 是一款由玩家操作单一游戏角色,进行多人对战的竞技游戏。Open AI 尝试把游戏规则教会给人工智能,之后开始让它不断和自己对战来提高水平。
Open AI 的开发工程师 Jakub Pachocki 介绍说:” Dota 2 的人工智能最开始只会在地图上乱跑,莫名地死于敌人攻击后,它开始学会哪些行为是错误的,逐渐地它开始学会补兵,攻击对面英雄,训练过程中其实没有突然的大突破,就是一点点地升级。基本的学会以后就也逐渐学会比较复杂的操作了。“
Open AI 的网站介绍了人工智能如何通过自我训练来掌握敌人出现后可能会做出的操作数据,并作出最正确的应对。OpenAI 的 CTO Greg Brockman 解释说,Dota2 的人工智能从零开始,训练了一个小时以后就已经可以打过内置的 AI 了,连续训练了 2 个星期的时间后就达到战胜职业玩家的水平。
令人惊讶地是,在 Open AI 的内部测试中,人工智能已经完全战胜了世界知名Dota2 选手 SumaiL 和 Arteezy 等人。
钥匙体育馆内的比赛也和之前内部测试的结果一样,Dendi 在第一局比赛中以 2:0 告负,而第二局比赛开始仅短短十分钟之后,Dendi 就选择了直接认输,此时AI的实力相比第一局已经更上一个层次,而在此期间并没有程序员为AI添加代码,这就是自我学习。
比赛中AI正在卡兵:
在此之前的游戏 AI 大多建立在由策划设计的游戏脚本上,AI 的行为完全由脚本触发执行,它的智能程度取决于游戏策划考虑的细致程度,所以和游戏 AI 会在比赛中出现固定的行动模式和大量模仿玩家策略的战术表现。
但 Open AI 的人工智能带来了新的体验。它并不是通过脚本行动,也没有使用模仿学习或者数据搜索,而是从头记录 Dota2 的规则,通过和自我对战来了解每一种行动会产生什么后果,从而预测其他玩家下一步可能的操作,做到了在复杂环境下的随机应变。而仅仅训练 2 个星期就打败 Dendi的 Dota2 人工智能,也计划用长达 1 年的时间来实现可以和人类进行团体对战的功能。