AI导航

Anthropic 发布 Claude Sonnet 5,智能体能力下放至 Sonnet 档

AI资讯
2 min read
3 次阅读

2026 年 6 月 30 日,Anthropic 正式发布 Claude Sonnet 5。它不是一次单纯的跑分升级:Anthropic 把规划、浏览器操作、终端调用和长流程执行能力进一步下放到 Sonnet 价位,让原本需要更昂贵 Opus 模型承担的部分智能体任务,有了成本更低的选择。

价格更低,但迁移成本不能只看单价

Sonnet 5 已面向 Claude 全部套餐开放,并成为 Free 和 Pro 的默认模型;开发者可在 Claude API 中调用 claude-sonnet-5。2026 年 8 月 31 日前,API 限时价格为每百万输入 token 2 美元、输出 token 10 美元,之后恢复为输入 3 美元、输出 15 美元。相比之下,Opus 4.8 为输入 5 美元、输出 25 美元。

需要注意的是,Sonnet 5 使用了更新后的 tokenizer,同一份内容可能产生约 1.0 至 1.35 倍 token。团队评估迁移成本时,应拿真实代码库、文档和工具调用链路做一次完整计费测试,不能只比较价目表。

真正的升级在于把任务做完

Anthropic 将 Sonnet 5 定位为目前智能体能力最强的 Sonnet 模型。官方披露,它在推理、工具使用、编程和知识工作方面明显超过 Sonnet 4.6;在部分高 effort 设置下,搜索和计算机操作能力可接近 Opus 4.8。对开发团队而言,价值不只是生成一段代码更快,而是模型能否持续追踪计划、调用工具、验证结果,并减少做到一半就停下的情况。

这意味着日常缺陷修复、跨文件修改、资料检索和常规业务自动化,可以优先测试 Sonnet 5;高风险决策、极复杂工程任务或对可靠性要求极高的流程,仍应保留 Opus 4.8 作为升级通道。更稳妥的部署方式是按任务难度动态路由,而不是一次性替换所有模型。

安全改进不等于能力没有边界

官方安全评估显示,Sonnet 5 的幻觉、谄媚和提示注入受骗率整体低于 Sonnet 4.6,并默认启用网络安全防护。但 Anthropic 同时强调,它的高危网络安全能力明显弱于当前 Opus 模型,且在部分自动化行为审计中仍不如 Opus 4.8。企业接入浏览器、终端或内部系统时,权限最小化、关键操作审批和结果复核仍然不可省略。

对大多数团队,这次发布最值得关注的不是“Sonnet 是否取代 Opus”,而是中档模型已经能承担更多端到端工作。接下来真正需要重测的是任务成功率、总 token 消耗和人工接管次数。

官方来源:Anthropic:Introducing Claude Sonnet 5

推荐工具

NVIDIA Chat with RTX AI聊天 Chat with RTX 是 NVIDIA 面向 RTX 电脑的本地 AI 聊天工具,可围绕本地文档和视频资料做问答,适合重视隐私、离线检索并具备硬件条件的用户更适合资料不便上传云 文心一言 AI聊天 文心一言 是百度文心大模型 AI 助手,支持百度 AI 聊天、文案创作和图像理解,适合中文用户和内容创作者完成 AI 对话、资料问答和任务协作,适合上线前核对权限、成本和资料质量。 HuggingChat AI聊天 HuggingChat 是 Hugging Face 的开源模型聊天应用,支持 Omni 自动选模型,也可手动选社区开放模型对话。它适合体验开源模型、技术探索和问答,结果可能不稳定,重要内容需复核。 纳米AI搜索 AI搜索 纳米AI 是 360 旗下 AI 搜索和智能体入口,支持文字、语音、拍照提问、多模型协作与内容创作,适合中文用户做日常搜索、学习问答、移动查询、热点追踪、生活决策、知识整理和轻量创作。 Meta AI AI聊天 Meta AI 是 Meta 的个人 AI 助手,可在网页、应用、AI 眼镜及 WhatsApp、Instagram 中使用,支持问答、图像理解和语音交流,适合社交与生活场景,部分功能受地区限制。 Pi AI AI聊天 Pi AI 是 Inflection AI 推出的个人 AI 助手,强调情绪理解、陪伴式交流、生产力建议和安全对话,可在 pi.ai 与移动端使用。它适合日常思考、学习陪练和规划,不替代专业心理支持。