手机版
外游网盒子服务器

经过7万小时训练后,AI学会了玩《我的世界》,每天训练30小时

时间:2022-06-29 18:04:53 来源:外游网 编辑:外游网 浏览:

听课文

0:00/0:00

AI打败最后一条影龙指日可待。

2019年,为了研究和分析AI与儿童之间的智力差距,一群世界顶级研究人员在卡内基梅隆大学和微软的共同资助下,举办了一场名为“MineRL”的比赛。以知名游戏《我的世界》为舞台,要求经过训练的AI在限定时间内寻找游戏中的稀有物品3354钻石。

考虑到一个普通的孩子在观看了10分钟的教学视频后可以自己玩33,360,《我的世界》,这个挑战在外行人看来并不是很难,但事实是,参赛的AI在4天的限时挑战中进行了800多万次操作后仍然没有达到他们的目标。

从那以后,米纳尔竞赛就成了一年一度的科研项目。每年都有很多探索AI前沿技术的学者带着他们精心训练的AI来到《我的世界》挖钻石。去年的MineRL大赛吸引了国内外近60支队伍,400多名科研人员同台竞技,可见其重视程度。

近日,知名AI技术公司OpenAI终于实现技术突破,提前秒杀竞争对手。根据他们6月23日发表的论文,他们训练的AI已经达到了33,360,《我的世界》的熟练发挥。挖掘钻石对他们的人工智能来说轻而易举。毕竟它掌握了只有人类才能领悟的高级玩法:

为了让AI真正像人类一样“玩游戏”,OpenAI的研究人员推出了一种新颖便捷的AI训练方法:视频预训练。他们从相关伙伴处获取了《我的世界》演示视频和键盘鼠标操作记录,并根据这些操作习惯建立了逆动态模型(逆

动力学模型)来猜测模拟视频中鼠标和键盘的操作逻辑,然后反复演绎世界各地的《我的世界》视频来模拟人类的游戏习惯。

在被“强迫”观看了7万小时的视频后,OpenAI下的AI操作已经相当生动:缺氧时会主动浮出水面,饥饿时会吃腐肉充饥。在对研究人员的数据进行微调后,AI已经掌握了更高级的操作,包括在随机村庄中搜索宝箱,以及构建一个简单的“火柴盒”。

至于同行们辛辛苦苦研究的挖钻石方法,OpenAI也通过强化学习构建了科学合理的计算机模型。从获取木材到在工作台上制作钻石镐,总共需要24000次操作。对于比较熟练的老玩家来说,完成这个过程大概需要20分钟。但是经过今天AI的一次大规模训练,收集钻石的效率已经堪比人类了。

目前OpenAI已经将他们研究的预训练模型提交给MineRL竞赛,今年的研究团队也可以在这个模型的基础上根据他们的主攻方向进行微调。考虑到OpenAI优异的训练成绩,我认为今年的MineRL比赛将会是一场堪比神仙打架的高端比赛。也许很快,AI已经开始研究如何提速了。

声明:优质国外游戏攻略创作不易,来源:外游网。转载务必注明出处:https://www.waigamer.com/article/11556.html

① 扫二维码关注"外游网"或添加qq群:601619959 

② 领取外服游戏礼包、加速器时长、外游攻略、新游推荐

③ 赶紧扫一扫添加吧,Get外服游戏技巧~

评论