腾讯今日在 WAIC 上宣布开源混元3D 世界模型 1.0,该模型可以通过一句话或一张图片快速生成可漫游、可交互的沉浸式 3D 世界场景。这是业界首个开放源代码的 3D 世界生成模型,兼容主流 CG 流程,支持完全编辑和模拟。
一、文本与图像双输入生成 混元3D 世界模型 1.0 支持从自然语言描述或单张图像生成完整 3D 世界,无需复杂建模流程。
二、高速生成,效率显著 模型采用双阶段生成方法:先利用多视角扩散生成 RGB 图像,再通过前馈重建模型在几秒内生成完整 3D 资产,整体生成时间约 10 秒。
三、完整可编辑的 CG 流程兼容性 输出模型结构可直接用于 Blender、Unity、Unreal 等工具,支持材质、UV 编辑、动画绑定等后续处理。
四、应用价值广泛 适用于游戏开发、虚拟现实、元宇宙、数字内容创作、电商展示等场景,有助于大幅缩短资产创作周期并降低成本。
五、开源开放,助力生态共建 混元3D 世界模型 1.0 已开源发布,包括轻量版与标准版,企业与开发者可免费下载、部署和商业使用。腾讯还计划后续开放更多模型,如端侧小型大语言模型、多模态理解模型等。