Anthropic 发布 Claude Sonnet 5，智能体能力下放至 Sonnet 档

2026 年 6 月 30 日，Anthropic 正式发布 Claude Sonnet 5。它不是一次单纯的跑分升级：Anthropic 把规划、浏览器操作、终端调用和长流程执行能力进一步下放到 Sonnet 价位，让原本需要更昂贵 Opus 模型承担的部分智能体任务，有了成本更低的选择。

价格更低，但迁移成本不能只看单价

Sonnet 5 已面向 Claude 全部套餐开放，并成为 Free 和 Pro 的默认模型；开发者可在 Claude API 中调用 claude-sonnet-5。2026 年 8 月 31 日前，API 限时价格为每百万输入 token 2 美元、输出 token 10 美元，之后恢复为输入 3 美元、输出 15 美元。相比之下，Opus 4.8 为输入 5 美元、输出 25 美元。

需要注意的是，Sonnet 5 使用了更新后的 tokenizer，同一份内容可能产生约 1.0 至 1.35 倍 token。团队评估迁移成本时，应拿真实代码库、文档和工具调用链路做一次完整计费测试，不能只比较价目表。

真正的升级在于把任务做完

Anthropic 将 Sonnet 5 定位为目前智能体能力最强的 Sonnet 模型。官方披露，它在推理、工具使用、编程和知识工作方面明显超过 Sonnet 4.6；在部分高 effort 设置下，搜索和计算机操作能力可接近 Opus 4.8。对开发团队而言，价值不只是生成一段代码更快，而是模型能否持续追踪计划、调用工具、验证结果，并减少做到一半就停下的情况。

这意味着日常缺陷修复、跨文件修改、资料检索和常规业务自动化，可以优先测试 Sonnet 5；高风险决策、极复杂工程任务或对可靠性要求极高的流程，仍应保留 Opus 4.8 作为升级通道。更稳妥的部署方式是按任务难度动态路由，而不是一次性替换所有模型。

安全改进不等于能力没有边界

官方安全评估显示，Sonnet 5 的幻觉、谄媚和提示注入受骗率整体低于 Sonnet 4.6，并默认启用网络安全防护。但 Anthropic 同时强调，它的高危网络安全能力明显弱于当前 Opus 模型，且在部分自动化行为审计中仍不如 Opus 4.8。企业接入浏览器、终端或内部系统时，权限最小化、关键操作审批和结果复核仍然不可省略。

对大多数团队，这次发布最值得关注的不是“Sonnet 是否取代 Opus”，而是中档模型已经能承担更多端到端工作。接下来真正需要重测的是任务成功率、总 token 消耗和人工接管次数。

官方来源：Anthropic：Introducing Claude Sonnet 5

Anthropic 发布 Claude Sonnet 5，智能体能力下放至 Sonnet 档

价格更低，但迁移成本不能只看单价

真正的升级在于把任务做完

安全改进不等于能力没有边界

相关文章

推荐工具