谷歌、OpenAI争相让旗下AI玩《精灵宝可梦》游戏：衡量AI真正实力

时间：2026-01-26 01:13:29 来源：24直播网

电竞体育01月25报道据科技媒体 Tom's Hardware 今天报道，当今时代我们有无数种跑分测试和评测方法来衡量 AI 的聪明程度与能力，但最近一种相对小众的测试方法也在 AI 圈内引发关注。

目前，谷歌、OpenAI 和 Anthropic 等 AI 巨头正在让自家模型游玩经典的《精灵宝可梦》系列游戏，以此来评估 AI 性能表现。

Anthropic 公司 AI 部门负责人 David Hershey 对此表示：“《精灵宝可梦》之所以能吸引机器学习社区关注，是因为它不像《Pong》等简单游戏那样受限。这种游戏对电脑程序来说非常具有挑战性”。

Hershey 从去年开始在 Twitch 平台进行直播，每天的日常就是用公司自产模型 Claude 玩《精灵宝可梦》。这名负责人平时的工作就是帮助客户部署 AI，因此他开直播本质上也是在测试模型。

这名负责人给自家 AI 直播游戏的做法也启发了不少自由开发者，他们也陆续搞了“Gemini 玩《宝可梦》”“GPT 玩《宝可梦》”等类似的直播节目。

后来，这些直播甚至被谷歌和 OpenAI 注意到，开发团队有时还会客串直播间亲自调整模型参数，在官方力量注入下，Gemini 和 GPT 已经成功通关了 Gam Boy 时代的《宝可梦蓝》，目前已在挑战续作；而 Claude 至今还没打通任何一个版本。

至于为何要用《宝可梦》评估 AI 性能？Hershey 对此解释道：“因为它给我们提供了直观的方法观察模型表现，还能用量化指标评估性能”。

通常来讲，玩家在《宝可梦》系列游戏中需要升级、训练已有 / 刚抓的宝可梦，还要打败道馆馆主来捕捉新的宝可梦。这种游戏流程并非线性，而是充满着判断和取舍。

而且，玩家还要经常在游戏中做出选择：是先冒险挑战强大的训练家以获取珍稀宝可梦，还是稳扎稳打造出一支实力均衡的队伍。

显然，人类非常擅长做此类决策，这也是游戏的乐趣所在，但对于 AI 来说，这是一场关乎逻辑推理、风险评估以及长期规划能力的综合考验。

因此研究人员会深入剖析 AI 在游戏里的决策方式，深入理解模型的能力边界。

Hershey 还会将 AI 玩《宝可梦》的结果分享给客户以改进控制框架（IT之家注：harness），帮助他们提升算力使用效率，让模型更高效运转。

标签游戏衡量实力真正精灵

上一篇：朝你的F6猛攻！赛前Pyosik调侃Kanavi：我今天玩什么反野！

下一篇： S赛亚军连垫底队BRO都打不过KT.Aiming被Teddy抽陀螺鬼皇抽象辅助

谷歌、OpenAI争相让旗下AI玩《精灵宝可梦》游戏：衡量AI真正实力

热门专题

相关信息

LCK发布杯赛分均伤害前五：RulerDiablePeyzViclaGumayusi

TT教练总结比赛：很可惜很丑陋

1月网络游戏审批信息：177款游戏获批《愤怒的小鸟》等在列

Keria：Peyz主动沟通一直很信任他，每次打比赛都希望能玩到巴德

xiaohu以后应该不会当主播！Letme：他真正成熟是去WBG的时候！

TES发布战胜IG赛后返图：每一份拼搏都有回响！

腊八快乐！LNG分享选手照：给哥几个准备了腊八粥腊八蒜“粥”到

WBG分享对阵IG队内语音Xiaohu：和Rookie打的第十一年

里程碑：Bin、Xun、ON三人组携手达成在BLG的200出场

轻轻又松松！About伊泽瑞尔输出拉满TT全线劣势WE赢首局

01月16日CBA常规赛辽宁新疆全场录像

01月16日CBA常规赛北京山西全场录像

01月16日CBA常规赛同曦深圳全场录像

01月16日NBA常规赛老鹰开拓者全场录像

01月16日NBA常规赛雄鹿马刺全场录像

01月15日CBA常规赛广东上海全场录像

01月15日CBA常规赛北控江苏全场录像

01月15日CBA常规赛广厦四川全场录像

01月15日CBA常规赛青岛吉林全场录像

01月15日CBA常规赛山东宁波全场录像

相关集锦

湖人不敌黄蜂三球30+11&9记三分东契奇39分詹姆斯29+9+6

勇士20记三分射穿尼克斯！库里27+7巴特勒32+8穆迪三分9中7

开拓者力擒老鹰止连败杨瀚森未登场夏普24+9CJ战旧主20分

独行侠轻取爵士克莱26+6马绍尔22+6+4森萨博27分

马刺大胜送雄鹿3连败文班22+10卡斯尔19+10字母哥21+5

雷霆末节爆发再杀火箭亚历山大连续112场20+杜兰特23中7

绿军19分大逆转热火A西蒙斯赛季新高39分鲍威尔26分

活塞逆转太阳坎宁安复出16中3杜伦16+18格雷森阿伦33分

NBA柏林赛魔术20分逆转灰熊小瓦格纳复出末节13分JJJ30分

上海40分大胜广东洛夫顿26+6张镇麟22分胡明轩&徐杰26中5

热门TAG