玩家训练AI玩《宝可梦红》:5万小时没找到第二个道馆

  近日,国外一位名叫“Peter Whidden”的玩家对AI模型进行了50000小时的训练,试图教AI如何玩《宝可梦 红(Pokémon Red)》。

【游侠网】《宝可梦 红》AI游玩视频

  由于AI本质上并不关心如何通关游戏,Whidden设定了奖励目标,每当AI发现新东西时就能获得奖励点。这一机制是利用屏幕中像素点变化来触发的,但也导致了AI会长时间盯着有动画效果的水面发呆。

游侠网1

  为了让AI更好地进行学习,Whidden还添加了与宝可梦等级相关的奖励机制。然而,这一系统也导致了意外,AI在存放和替换宝可梦时会让奖励分数下降,因此在之后的行动中AI完全避开宝可梦中心,使得队伍得不到治疗,Whidden不得不再次调整奖励系统。

游侠网2

  尽管AI不擅长人类行为,但是却能做出了一些更为深奥的行动。Whidden意识到,AI走出奇怪的路径其实是为了保证只需扔出一个精灵球就能捕获野生宝可梦,并非是无意义的行动。

游侠网3

  最终,AI花费7千个小时击败了第一个道馆,但在月见山却迷路许久,耗时5万小时后还是没能找到第二个道馆。不过AI也贡献了许多神奇操作,比如最喜欢购买鲤鱼王,累计购买次数超过1万次。并在野外抓捕到小拉达时,会将其命名为“AI”。

游侠网4

THE END
喜欢就支持一下吧
点赞0 分享