
【编者按】在AI军备竞赛白热化的当下, Anthropic昨夜扔出一枚深水炸弹——Claude 4.5横空出世。这个被谷歌亚马逊押注的AI新贵,用「30小时连续自主编程」的恐怖纪录,彻底颠覆了行业对AI续航能力的认知。当科技巨头还在追逐消费级市场的流量狂欢时,Anthropic已悄然构筑起企业服务的铜墙铁壁。从金融建模到科学推演,从跨软件操作到操作系统级交互,这场没有硝烟的战争正在转向更深层的生产力革命。而微软与Anthropic的突然联姻,更预示着AI战场正在重构新的权力格局。
Anthropic周一发布Claude 4.5人工智能模型,这款最新版本能够进行更长时间不间断编程,并在金融与科学任务处理上表现更优——这家初创公司正朝着企业级AI领域纵深推进。
这家获Alphabet和亚马逊注资的AI新锐正与竞争对手展开赛跑,致力于开发能可靠操作软件、完成多步骤工作的模型,这些能力正是能代替人类执行任务的AI智能体的核心要素。
首席产品官Mike Krieger透露,Sonnet 4.5模型在内部测试中从零构建了网页应用,某客户见证了这个AI聊天机器人连续自主编程30小时——相较之前Anthropic为另一客户提供的Claude Opus 4模型实现的7小时纪录,实现了跨越式突破。
他明确表示,Anthropic将聚焦高端用户与企业客户,而非追逐消费级市场的病毒式传播。
公司数据显示,Claude 4.5在金融与科学推理领域表现更强劲,计算机操作能力显著提升——在测试操作系统灵活性的基准评估中得分约60%,而前代模型仅达40%。
“即便你不是程序员,当你亲眼看到模型像人类一样操作电脑时,那种震撼感会强烈得多。”首席科学官Jared Kaplan如是说。
同日另讯,微软宣布将为Microsoft 365 Copilot加载由Anthropic模型驱动的新功能,包括Excel与Word中的“代理模式”、Copilot聊天中的“Office助手”,PowerPoint相关功能也将陆续上线。
上周微软刚宣布将把Anthropic模型引入Microsoft 365 Copilot,这意味着其正突破与长期合作伙伴OpenAI的独家合作模式,谋求技术路线多元化。
由OpenAI前高管创建的Anthropic,始终为Claude设定职场应用的安全护栏,声称能有效降低风险输出。该公司持续向受监管行业及需要跨软件协作的团队,大力推广Claude的编程与数据分析能力。
Krieger强调,公司专注的是长周期任务中持续稳定的性能表现,而非短期演示效果。

