2026 年 6 月 28 日,埃隆·马斯克在 X 上确认,Grok 4.5 已进入 SpaceX 和 Tesla 的内部测试。它基于一套规模为 1.5T 的 V9 基础模型,并在补充训练中加入了 Cursor 数据;不过,这仍是私测阶段,官方尚未公布面向普通用户或 API 开发者的上线时间。
这次更新最值得关注的不是一个立即可用的新入口,而是 Grok 的研发路径开始更明确地与真实工程场景结合。SpaceX 和 Tesla 分别拥有航天、制造、车辆软件与复杂工程数据,内部测试可以帮助团队观察模型在代码、分析和多步骤任务中的实际表现。但马斯克没有说明参与人数、任务范围、是否接触生产系统,也没有披露安全评估流程,因此不能把“内部测试”理解为模型已经可以自主控制车辆或航天设备。
公开信息透露了哪些模型变化
马斯克称 Grok 4.5 的初步表现接近、甚至可能超过 Opus,同时强调强化学习仍在持续改善模型,Grok Build 工具链也在继续完善。这里有两个边界需要留意:其一,官方没有给出具体的 Opus 版本、测试集、分数或第三方评测;其二,加入 Cursor 数据并不等于完成了 Cursor 产品集成,现有信息只指向补充训练。
因此,这次表态更像研发进度披露,而不是可复现的性能发布。对开发者来说,真正能判断升级价值的材料仍包括 API 价格、上下文长度、工具调用稳定性、代码修改成功率和公开安全报告。上述信息目前都未同步公布。
谁会最先感受到影响
如果私测顺利,最先受益的可能是使用 Grok Build 处理大型代码库和长任务的开发团队,而不是只进行日常问答的普通用户。模型在真实企业环境里需要面对权限、旧代码、失败恢复和结果审查,这些能力比单次基准高分更能决定 Agent 是否可用。
马斯克还表示,SpaceX 今年计划按月训练全新模型。这显示其重点正在从单个版本发布,转向高频训练与内部反馈循环。但“按月训练”不等于“按月公开发布”,模型是否会进入 Grok、何时开放 API,仍需等待正式公告。
下一步看什么
用户现在不需要因为私测消息调整订阅或迁移工作流。更稳妥的做法是等待官方模型卡、公开评测、价格和发布范围;企业团队还应关注数据如何用于补充训练,以及内部工具调用是否提供审批与审计能力。只有这些条件明确后,Grok 4.5 才能从研发信号变成可执行的产品选择。
官方来源:埃隆·马斯克关于 Grok 4.5 私测的公告。