IT之家 5 月 4 日消息,谷歌最先进的人工智能模型取得了重大突破:成功通关了一款 29 年前的电子游戏。
谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在 X 网站上兴奋地宣布:“太精彩了!Gemini 2.5 Pro 刚刚完成了《宝可梦蓝》!”
据IT之家了解,此次直播活动名为“Gemini Plays Pokemon”,由一位名叫 Joel Z 的 30 岁软件工程师发起,他并非谷歌员工。尽管如此,谷歌高管们对这一尝试表示了支持。谷歌 AI Studio 的产品负责人洛根・基尔帕特里克(Logan Kilpatrick)上个月曾表示,Gemini 在完成《宝可梦》方面取得了显著进展,并且已经获得了第五个徽章(目前表现第二好的模型只获得了三个徽章,不过使用的是不同的代理框架)。皮查伊还开玩笑说:“我们正在开发 API,即人工宝可梦智能。”
为何选择《宝可梦》?早在今年 2 月,Anthropic 公司就曾强调其 Claude AI 模型在《宝可梦红》中的表现,称 Claude 的“深度思考和代理训练”使其在应对“更出人意料”的任务时更具优势,例如玩经典游戏。但 Claude 似乎尚未通关《宝可梦红》,这是否意味着 Gemini 在游戏方面表现更胜一筹?Joel Z 在他的 Twitch 页面上提醒观众:“请不要将此视为衡量大型语言模型(LLM)玩宝可梦能力的基准。两者之间无法进行直接比较,因为 Gemini 和 Claude 使用不同的工具,并且接收到的信息也不同。”
此外,两款 AI 模型都需要借助代理框架才能玩游戏。这些框架为模型提供带有额外信息的游戏截图,使模型能够据此做出决策(可能涉及调用专业代理),并按下与 AI 指令相对应的按钮。
Joel Z 承认,在帮助 Gemini 完成游戏的过程中,他确实进行了一些“开发干预”,但他强调这并非作弊。“我的干预是为了提升 Gemini 的整体决策和推理能力。我不会给出具体提示词,也不会为特定挑战(如月球山脉)提供攻略或直接指令。唯一接近这种情况的是,我告诉 Gemini 需要与火箭队小兵对话两次才能获得升空钥匙,这其实是一个在《宝可梦黄》中被修复的漏洞。”
他还表示:“Gemini Plays Pokémon 仍在积极开发中,其框架也在不断演变。”
相关文章
IT之家 6 月 19 日消息,美国得克萨斯州当地时间周三晚,SpaceX 公司的一次例行测试发生意外。该公司旗下的星舰 36 号火箭在进行静态点火测试时突然发生爆炸,现场瞬间变成一片巨大的火球。据目击者提供的视频显示,当晚大约 11 点左右,星舰 36 号火箭在马斯克的星舰基地测试场进行测试时,其
2025-06-19 13:21:00你可能没有抢到LABUBU,但你一定听过LABUBU!最近,丑萌丑萌的LABUBU,以“黑马”姿态跻身全球顶流。它“比爱马仕还难买”,刘亦菲、舒淇、贝克汉姆等都是它的粉丝。外网销量榜断层第一,直播间12万人在线拼手速,英国人大打出手、美国人凌晨三点排队……抢的都是它。数据显示,LABUBU去年一年狂
2025-06-18 12:01:006月16日消息,知名博主数码闲聊站曝光了一加15核心配置细节。从屏幕规格到性能内核,从影像系统到外观设计,释放的信息量可不少。图源:微博截图据爆料,一加15果断「逆行」,抛弃了一加13的2K等深微曲屏,转而采用6.78英寸的1.5K极窄边大直屏。难道直屏才是真正的“密码”?对于一加15屏幕的这一转变
2025-06-16 18:30:0045 岁的张女士对着体检报告愣住了:血脂、尿酸、胆固醇三项指标全线飘红。作为吃了 20 年牛肉的 “资深食客”,她一直坚信牛肉是 “滋补圣品”—— 脸色差了喝牛腩汤,精力不济来盘香煎牛排,甚至把牛肉当 “保健品” 天天吃。直到医生一句 “是不是经常吃牛肉”,才让她惊觉:这碗吃了二十年的 “补汤”,可
2025-06-13 10:08:00骆驼制片有限责任公司IT之家 6 月 12 日消息,美国演员工会 - 美国电视和广播艺术家联合工会(SAG-AFTRA)已暂停对十家游戏工作室的罢工行动。该组织的全国委员会将于明日召开会议,审议与这些游戏开发商达成的临时协议。如果委员会同意协议条款,更多细节将被披露。据 Variety 获得的一份来
2025-06-12 07:47:00热门文章