AI资讯

OpenAI公开代理抗提示注入方法：不只拦文本攻击，开始管住危险动作和数据出口

OpenAI 这次谈的不是模型回答得像不像，而是代理在面对提示注入和社工攻击时，怎么避免被带着去执行危险动作。这个角度很关键，因为 Agent 一旦能调工具、读文件、发请求，安全问题就不再只是输出内容本身。文章给出的方向是把防线前移：对高风险动作做约束，对敏感数据做保护，在代理工作流里减少被提示注入带偏后的执行空间。换句话说，真正要防的不是某一句恶意提示，而是代理有没有能力越过边界去做错事。 ...

AI导航 • 2026年3月12日 • 34

乐天把Codex接进研发链路：故障修复快一倍，CI/CD审查开始由代码代理接手

AI资讯

Rakuten 这次用 Codex 交出的不是概念演示，而是一组企业最关心的研发指标：故障修复更快，CI/CD review 更自动化，整站构建周期也被明显缩短。对代码代理赛道来说，这类案例比单次写出一段代码更有说服力。 OpenAI 在描述里提到，Rakuten 用 Codex 做到了 MTTR 下降 50%，并让一些 CI/CD 审查动作自动化。这意味着 AI 编程工具开始真正进入工程流程中...

AI导航 • 2026年3月12日 • 51

vLLM升级0.17.1：MoE后端、Mamba缓存和MTP处理一起修，推理框架继续做细底层兼容

AI资讯

vLLM 0.17.1 没有铺陈太多概念，直接把补丁落在推理底层：TRTLLM 的 MoE 路径、Mamba 和 Qwen3.5 的缓存块处理，以及 MTP 的索引优化都被列进官方说明。对跑推理服务的团队来说，这种版本往往比大而全的新功能更有用。推理框架一旦进入复杂模型和异构后端，很多问题并不是“能不能跑”，而是某个后端、某种精度或某条缓存链路会不会在负载下出错。vLLM 这次就是针对这些细节...

AI导航 • 2026年3月12日 • 101

CrewAI更新1.10.2a1：动态工具注入、并发锁问题和MCP解析一起修，代理框架更重稳定性

AI资讯

CrewAI 这次更新把一组真正影响落地的问题凑到了一版里解决：一边新增动态工具搜索和更多 Brave Search 工具，另一边把多进程锁异常、并发结果聚合、MCP 解析和上下文传递问题一起修掉。对代理框架来说，这比多一个概念功能更关键。官方 release notes 里还提到，GitPython 被升级用来修补路径遍历类安全问题，memory 类也做了可序列化重构。这说明 CrewAI ...

AI导航 • 2026年3月12日 • 63

OpenHands升级1.5.0：仓库切换、任务看板和规划代理一起补位，开发代理开始更像完整工作台

AI资讯

OpenHands 1.5.0 这次把几个关键缺口一起补上了：现有会话可切换仓库、右侧任务列表能实时看状态、聊天框里还能直接拉出技能和命令菜单。对长期跑开发任务的团队来说，这种改动比单纯多接一个模型更有价值，因为它直接影响代理是不是能被连续使用。官方还在这一版加入了 planning agent、Bitbucket datacenter 支持，以及一批新模型接入，同时修掉了多项 UI 问题和依...

AI导航 • 2026年3月12日 • 39

LangChain升级1.2.12：工具调用追踪更细了，框架迭代开始把调试体验做成默认能力

AI资讯

LangChain 1.2.12 看起来是个小补丁，但它补的地方很关键：wrap model 和 tool call tracing。对日常在框架里接模型、挂工具、串工作流的团队来说，这种追踪能力往往比再加一个新组件更实用，因为它直接关系到排错速度。官方 changelog 很短，却恰好点在开发者最常遇到的问题上——模型包裹层和工具调用层的可见性还不够细。LangChain 现在把 traci...

AI导航 • 2026年3月12日 • 44

Google谈青少年生成式AI安全：先做年龄适配和防护，再把Gemini学习工具推向教育场景

AI资讯

Google 这次围绕青少年生成式 AI 安全讲得很完整，重点不是一句“我们重视安全”，而是把年龄适配、隐私保护、内容限制、红队评测和学习工具一起摆上台面。对 AI 产品来说，这代表年轻用户场景开始进入更严格的产品设计阶段。文章里提到，Google 会在模型与产品层面使用分类器和 safeguard 来限制不适龄内容，还会通过对抗测试和与儿童发展专家合作来发现新风险。它甚至点出了 2025 年...

AI导航 • 2026年3月12日 • 36

MiniMax推出M2.1：多语言代码能力再抬升，办公复合指令和Agent工作流一起进化

AI资讯

MiniMax 这次把 M2.1 的定位说得很清楚：不是只卷 Python，而是要把多语言编程、移动开发和办公室里的复合指令场景一起做好。这个方向很现实，因为企业和开发团队真正遇到的任务，本来就不是单一语言、单一页面和单一步骤。官方文章里提到，M2.1 一口气强化了多种编程语言能力、Web/App 开发表现、复合约束执行，以及在各类编程工具和 Agent 框架里的泛化表现。同时它还强调响应更简...

AI导航 • 2026年3月12日 • 27

OpenAI把计算机环境接进Responses API：代理不再只会回话，开始能在容器里真执行

AI资讯

OpenAI 这次把计算机环境正式带进 Responses API，信号很明确：代理能力不再只靠函数调用拼起来，而是开始拥有能处理文件、运行命令和维持状态的执行空间。对开发团队来说，这比单纯增加一个工具接口更重要，因为它决定了 Agent 能不能真正承担连续任务。文章把重点放在 agent runtime 的搭建方式上，包括 Responses API、本地 shell tool 和托管容器的...

AI导航 • 2026年3月12日 • 18

YouTube扩大AI肖像识别试点：公众人物与记者进入保护范围

AI资讯

YouTube 正在扩大 AI 肖像识别试点，把更多公众人物和记者纳入检测与申诉范围。相比一般内容治理更新，这次动作更直接地落在“深伪内容如何被发现、如何被处理”这个现实问题上。平台侧这一步说明，AI 生成内容的治理已经从通用政策进入更细分的人群保护阶段。记者、政界人士和高曝光公众人物更容易成为伪造目标，因此平台需要更主动的检测和申诉机制，而不能只依赖事后举报。这条更新值得关注，是因为它反...

AI导航 • 2026年3月11日 • 16