AI资讯

Skywork Super Agents:开启 AI 办公代理新时代

AI资讯

**Skywork Super Agents:全球首个多模态 AI 工作区代理,明日登陆 Product Hunt** **一、Skywork Super Agents 简介** Skywork Super Agents 是由昆仑万维推出的一款基于 Deep Research 技术的 AI 办公套件,旨在通过多模态内容生成和深度研究能力,提升用户的工作效率。该产品将于明日正式在 Product...

AI导航 58

ChatGPT移动应用增长背后的四大关键驱动因素

AI资讯

**ChatGPT移动应用日均使用时长接近20分钟,较发布初期增长三倍** **一、ChatGPT移动端用户粘性显著提升** 根据OpenAI联合创始人Greg Brockman在X平台上的最新披露,目前ChatGPT移动应用的用户日均使用时长已经接近每人每天20分钟。这一数字相比应用刚发布时已经增长了三倍,反映出用户对移动AI助手依赖程度的显著提升。 **二、用户参与度全面攀升** Ch...

AI导航 5

从提示到部署:AI Studio 一站式应用开发流程

AI资讯

**Google AI Studio 推出原生代码辅助功能,支持差异视图和灵活编码体验** **一、AI Studio 原生代码辅助功能上线** 在 2025 年的 Google I/O 大会上,Google 宣布为 AI Studio 引入原生代码辅助功能,旨在提升开发者的编码体验。该功能由 Gemini 2.5 Pro 模型驱动,允许开发者直接在 AI Studio 的“应用”部分使用差异...

AI导航 5

ChatGPT与Box AI代理协同:企业内容智能化新范式

AI资讯

**ChatGPT与Box AI代理协同:企业内容智能化的未来范式** **一、AI代理与内容平台的深度融合** 近日,Box联合创始人兼CEO Aaron Levie 在X平台上分享了一段令人瞩目的演示:ChatGPT与Box平台集成,执行深度市场分析任务。这一场景展示了AI代理与企业内容平台协同工作的强大潜力,标志着企业内容管理和智能化分析迈入新纪元。 **二、Box AI代理的核心能力...

AI导航 5

Rork支持的后端服务集成详解:Supabase、Firebase与Airtable的应用

AI资讯

**Rork:由Claude 4驱动的零代码App生成器,开启AI开发新时代** **一、Rork简介:无需编程,轻松构建移动应用** Rork是一款由Anthropic的Claude 4模型驱动的AI应用生成平台,旨在帮助用户无需编程经验即可快速创建功能完善的移动应用。用户只需输入简短的应用描述,Rork便能自动理解需求,生成完整的界面、功能和逻辑代码,支持iOS和Android平台的跨平台...

AI导航 9

Google三款新模型发布:AI在医疗、无障碍和动物语言领域的应用前景

AI资讯

**Google发布三款基于Gemma模型的变体:MedGemma、SignGemma与DolphinGemma** **一、MedGemma:面向医疗领域的多模态与文本推理模型** Google推出的MedGemma是基于Gemma 3架构的医疗AI模型,分为两个版本: * **MedGemma 4B**:多模态模型,结合了SigLIP图像编码器和语言模型,专为处理医学图像与文本任务设计。...

AI导航 4

Grok 3.5被爆即将发布:多模态AI模型的新突破

AI资讯

**Grok 3.5 API即将发布:xAI新模型“grok-3-5-api-2k-p2”曝光,支持灵活输入** **一、Grok 3.5即将上线,API接口现踪迹** 近日,xAI正在为即将发布的Grok 3.5模型做准备。在最新的Web构建中,发现了一个新的模型引用“grok-3-5-api-2k-p2”,以及“grok 3.5 flexible input”的提及。这表明Grok 3.5...

AI导航 1

字节跳动开源的统一多模态推理模型BAGEL

AI资讯

**BAGEL:字节跳动开源的统一多模态推理模型,挑战GPT-4o与Gemini 2.0** **一、BAGEL简介:统一的多模态理解与生成模型** BAGEL(ByteDance Adaptive Generalized Expert Learner)是字节跳动Seed团队在2025年5月开源发布的多模态大模型。该模型以统一的架构支持文本、图像、视频等多模态数据的理解与生成,具备与GPT-4...

AI导航 3

AI 视频生成的未来:Veo 3 引领的技术变革

AI资讯

**Google Veo 3 正式发布:AI 视频生成进入音画同步新时代** 在 2025 年的 Google I/O 开发者大会上,Google DeepMind 正式发布了其最新一代 AI 视频生成模型 Veo 3。该模型不仅能够根据文本或图像提示生成高质量的视频,还首次实现了音频与画面的同步生成,包括背景音效、环境音、音乐以及角色对白,标志着 AI 视频生成从“无声电影时代”迈入“音画同步...

AI导航 24

从工具到智能体:OpenAI Responses API 的演进路径

AI资讯

**OpenAI Responses API 功能大升级:支持图像生成、代码解释器、远程 MCP 等新工具** OpenAI 近日对其开发接口 Responses API 进行了重大功能升级,新增图像生成、代码解释器、远程 MCP 连接和文件搜索增强功能。这些新特性大幅提升了模型能力,使开发者在构建智能体(Agent)与企业级应用时拥有更强的工具链支持。 **一、远程 MCP 支持:连接企业级...

AI导航 7