在刚刚的一场直播中,知名游戏主播Gemini 2.5 Pro成功通关《宝可梦蓝》这款游戏,这一举动引起了广大网友的热烈讨论。谷歌CEO第一时间兴奋官宣,放出通关时刻珍贵影像。相较于一年前只能勉强走到常磐森林的旧模Claude 3.5,Gemini 2.5 Pro的通关表现无疑让人眼前一亮。
大模型的进步让这一成就更显得意义非凡,它不仅让Gemini的自我介绍增添了一条新内容,也引发了网友们的一片赞叹。然而,通关过程看似有些无聊,因为每一步都需要Gemini深思熟虑,这背后显示了大模型对宝可梦游戏的深入理解。
在直播中,Gemini的主要目标是探索华蓝洞穴,寻找和捕获超梦。在完成了一长串行动,到达目标位置之后,Gemini足足思考了40多秒才开启下一步的行动规划。虽然有些迷路,但这些思考过程展示了模型如何理解宝可梦游戏。总结起来,Gemini玩宝可梦的基本步骤包括:截取屏幕截图并检索游戏状态数据、将屏幕截图和游戏信息发送给模型、AI决定是直接响应还是调用专门的智能体、解析响应内容以确定按下哪个按钮、执行按钮按下操作并等待游戏更新等步骤。
如果你对Gemini的宝可梦直播感兴趣,可以在twitch上搜索“gemini plays pokemon”,我们也会在文末奉上链接。虽然已经是联盟冠军,但大模型在宝可梦这款游戏中表现明显不如人类,经常迷路等。这主要是因为大模型“视力不佳”,难以像人类一样解读Game Boy屏幕里的世界。不过,大模型在偏文本的部分已有惊艳表现,比如在宝可梦对战中能够及时理解攻击效果并调整战斗策略。
谷歌率先实现了新的突破,表示还将在这个有趣的挑战中进行更多探索(直播将至少持续数天)。或许未来测试大模型的基准真的会变成谁能更快通关宝可梦了。
首个AI冠军:Gemini2.5Pro大模型直播通关《宝可梦蓝》
IT之家
小红书开源文本大模型dots.llm1
近日,小红书技术团队宣布了一项重要进展。其旗下的人文智能实验室(hi lab)首次开源了文本大模型dots.llm1,这一消息引发了业内广泛关注。dots.llm1采用了先进的Mixture of Experts(MoE)架构设计。该模型总...
界面新闻|2025-06-11 08:40
国产大模型首次落地汽车制造全场景 智平方机器人进驻东风柳汽
东风柳州汽车有限公司与智平方(深圳)科技有限公司于6月7日在深圳签署战略合作协议。双方将重点探索具身大模型技术在汽车制造领域的深度应用,这是该技术首次在汽车行业实现全场景落地。根据合作协议,智平方研发的GOVLA全域全身视觉语言动作模型将应...
IT之家|2025-06-09 22:08
苹果研究:AI大模型只是记忆而非真正推理
苹果机器学习研究中心近日发布了一项引人深思的研究成果,对当前主流AI模型的推理能力提出了质疑。这项研究由Parshin Shojaee等人主导,通过系统评估OpenAI、DeepSeek、Anthropic和谷歌等公司的前沿AI模型,揭示了...
IT之家|2025-06-09 18:24
国产大模型成功通过汽车制造全流程测试
6月7日,东风柳州汽车有限公司与智平方(深圳)科技有限公司在深圳签署战略合作协议。双方将展开深度合作,重点探索具身大模型技术在汽车制造领域的全方位应用场景。这是该技术在国内汽车制造业的首次大规模实践。根据协议内容,智平方研发的通用智能机器人...
界面新闻|2025-06-09 14:08
面壁智能推出新一代端侧大模型"前进四"MiniCPM 4.0,性能表现突出
面壁智能近日发布了新一代端侧大模型MiniCPM 4.0,该系列包含8B和0.5B两种参数规模的模型。据官方介绍,新模型通过自研CPM.cu推理框架实现了显著性能提升,在极限场景下最高可提速220倍,常规情况下也有5倍的提速表现。其中8B版...
IT之家|2025-06-09 07:48
"机械师TH60耳机首发134元:10mm动圈+实时翻译黑科技"
机械师最新推出了一款TH60 AI耳机,主打AI大模型同声翻译功能。这款耳机定价149元,首发优惠价仅需134.1元,性价比相当突出。它支持高达145种语言的实时翻译,无论是英语课件、韩剧台词,还是各地方言都能轻松应对,并配有专属App提升...
IT之家|2025-06-08 22:08
AI盛会再掀热潮 具身智能成新焦点
第七届北京智源大会于6月6日开幕,这场被誉为"AI春晚"的盛会再次成为行业焦点。今年大会的关键词从大语言模型转向"具身智能"与"机器人2.0",宇树科技CEO王兴兴等业界领袖成为新晋明星。三年来,智源大会见证了AI技术从语言模型到多模态,再...
每日经济新闻|2025-06-08 15:40
面壁智能推出新一代MiniCPM 4.0 手机端大模型
6月6日晚,面壁智能正式发布了新一代端侧大模型MiniCPM 4.0。这款新模型采用了公司自主研发的CPM.cu推理框架,在性能优化方面取得了显著突破。据官方介绍,该框架在极限场景下能够实现最高220倍的提速效果,常规情况下也能带来5倍的性...
界面新闻|2025-06-08 11:56
开源多模态AI崛起 加速突破物理世界边界
2025智源大会于6月6日至7日在北京中关村成功举办。本次大会汇聚了国内外人工智能领域的专家学者和产业代表,重点围绕AI技术发展、具身智能等前沿议题展开深入交流。与会者共同探讨了行业现状及未来发展方向,为人工智能技术的创新与应用提供了重要思...
财联社|2025-06-08 11:32
腾讯公益引入AI助手,用户可实时咨询公益项目问题
腾讯公司近日在公益领域推出了一项创新功能。据腾讯公关总监透露,腾讯公益平台悄然上线了"问AI"服务,用户可以直接针对公益项目、机构及相关问题进行提问。这标志着腾讯首次将大模型技术应用于公益事业,为公众参与公益活动提供了智能化渠道。今年3月,...
IT之家|2025-06-06 12:40
中国水利行业推出智能大模型,融合海量数据与双引擎技术
近日,水利部国科司组织中国水科院成功研发并发布了"水利标准 AI 大模型"。这一创新成果已在水利技术标准专题评估工作中得到实际应用,标志着我国水利标准化管理迈入智能化新阶段。该模型基于中国水科院"SkyLIM"体系,采用"海量知识库+Dee...
IT之家|2025-06-05 17:40
"小鹏汽车研发车载语音识别新技术获专利"
近日,广州小鹏汽车科技有限公司公布了一项名为"声学语义大模型、服务器、语音交互方法和存储介质"的专利。这项专利于6月3日通过天眼查财产线索信息对外披露。该专利的核心内容围绕一种新型的声学语义大模型展开。该模型由四个关键模块组成:声学编码模块...
界面新闻|2025-06-04 14:56
本信息来自互联网,不代表导读网立场,如若转载,请注明出处:http://www.frfey.com/news/48460/