2026 年 6 月 30 日,Anthropic 正式发布 Claude Sonnet 5。它不是一次单纯的跑分升级:Anthropic 把规划、浏览器操作、终端调用和长流程执行能力进一步下放到 Sonnet 价位,让原本需要更昂贵 Opus 模型承担的部分智能体任务,有了成本更低的选择。
价格更低,但迁移成本不能只看单价
Sonnet 5 已面向 Claude 全部套餐开放,并成为 Free 和 Pro 的默认模型;开发者可在 Claude API 中调用 claude-sonnet-5。2026 年 8 月 31 日前,API 限时价格为每百万输入 token 2 美元、输出 token 10 美元,之后恢复为输入 3 美元、输出 15 美元。相比之下,Opus 4.8 为输入 5 美元、输出 25 美元。
需要注意的是,Sonnet 5 使用了更新后的 tokenizer,同一份内容可能产生约 1.0 至 1.35 倍 token。团队评估迁移成本时,应拿真实代码库、文档和工具调用链路做一次完整计费测试,不能只比较价目表。
真正的升级在于把任务做完
Anthropic 将 Sonnet 5 定位为目前智能体能力最强的 Sonnet 模型。官方披露,它在推理、工具使用、编程和知识工作方面明显超过 Sonnet 4.6;在部分高 effort 设置下,搜索和计算机操作能力可接近 Opus 4.8。对开发团队而言,价值不只是生成一段代码更快,而是模型能否持续追踪计划、调用工具、验证结果,并减少做到一半就停下的情况。
这意味着日常缺陷修复、跨文件修改、资料检索和常规业务自动化,可以优先测试 Sonnet 5;高风险决策、极复杂工程任务或对可靠性要求极高的流程,仍应保留 Opus 4.8 作为升级通道。更稳妥的部署方式是按任务难度动态路由,而不是一次性替换所有模型。
安全改进不等于能力没有边界
官方安全评估显示,Sonnet 5 的幻觉、谄媚和提示注入受骗率整体低于 Sonnet 4.6,并默认启用网络安全防护。但 Anthropic 同时强调,它的高危网络安全能力明显弱于当前 Opus 模型,且在部分自动化行为审计中仍不如 Opus 4.8。企业接入浏览器、终端或内部系统时,权限最小化、关键操作审批和结果复核仍然不可省略。
对大多数团队,这次发布最值得关注的不是“Sonnet 是否取代 Opus”,而是中档模型已经能承担更多端到端工作。接下来真正需要重测的是任务成功率、总 token 消耗和人工接管次数。