2026 年 6 月 30 日,Google 发布 Nano Banana 2 Lite,并向开发者开放 Gemini Omni Flash 预览版。两款模型分别瞄准高频图像生成和对话式视频制作,核心变化不是追求单张作品的最高上限,而是把生成速度、调用成本和批量生产能力继续往实用区间推进。
Nano Banana 2 Lite 面向高吞吐出图
Nano Banana 2 Lite 的 API 名称为 gemini-3.1-flash-lite-image。Google 给出的文本生图延迟约为 4 秒,1K 分辨率图片价格为每张 0.034 美元。它已进入 Google AI Studio、Gemini API 和 Gemini Enterprise Agent Platform,并开始在 Gemini 应用、搜索 AI Mode 等消费产品中上线。
在产品定位上,Lite 版适合草图、批量素材、交互式原型和预算敏感的工作流;常规质量与成本平衡仍由 Nano Banana 2 承担,复杂专业任务则更适合 Nano Banana Pro。对开发者而言,这种分层比“所有请求都调用最强模型”更重要:可先用 Lite 生成候选和低分辨率预览,仅把入选结果交给更高档模型精修。
Omni Flash 把生成与编辑放进同一轮对话
Gemini Omni Flash 的 API 名称为 gemini-omni-flash-preview,支持同时接收文本、图片和视频输入,并用自然语言继续修改视频。官方定价为每秒输出 0.10 美元,与 Veo 3.1 Fast 相同。它不仅能从提示生成视频,也能利用参考素材保持场景与视觉方向,再通过对话调整动作、画面元素和叙事逻辑。
当前版本仍有清晰限制:单次生成时长为 10 秒,API 暂不支持音频参考和场景延展;最长 3 秒的视频参考虽然可被接口接收,但暂时不能被模型正确处理,跨场景或镜头移动时的人物一致性也可能波动。因此它更适合广告分镜、短片概念验证和局部效果测试,尚不能直接替代完整后期流程。
成本下降会改变工作流,而不只是降低账单
更快的图像模型可以让产品把“生成一次”改成“连续预览”,低价短视频则让小团队更容易在正式拍摄前验证构图和节奏。但批量调用也会迅速放大审核、版权和素材管理压力。上线前应分别设置单任务预算、生成次数上限和人工筛选节点,并记录使用的模型版本,避免预览模型更新后结果无法复现。
这次发布最直接的影响,是图像与视频生成正在从独立创作工具变成可嵌入业务流程的基础能力。真正能拉开差距的,将是模型分层、素材复用和质量审核,而不是单次提示词技巧。
官方来源:Google:Start building with Nano Banana 2 Lite and Gemini Omni Flash