AI资讯
OpenAI公开代理抗提示注入方法:不只拦文本攻击,开始管住危险动作和数据出口
AI资讯OpenAI 这次谈的不是模型回答得像不像,而是代理在面对提示注入和社工攻击时,怎么避免被带着去执行危险动作。这个角度很关键,因为 Agent 一旦能调工具、读文件、发请求,安全问题就不再只是输出内容本身。 文章给出的方向是把防线前移:对高风险动作做约束,对敏感数据做保护,在代理工作流里减少被提示注入带偏后的执行空间。换句话说,真正要防的不是某一句恶意提示,而是代理有没有能力越过边界去做错事。 ...
乐天把Codex接进研发链路:故障修复快一倍,CI/CD审查开始由代码代理接手
AI资讯Rakuten 这次用 Codex 交出的不是概念演示,而是一组企业最关心的研发指标:故障修复更快,CI/CD review 更自动化,整站构建周期也被明显缩短。对代码代理赛道来说,这类案例比单次写出一段代码更有说服力。 OpenAI 在描述里提到,Rakuten 用 Codex 做到了 MTTR 下降 50%,并让一些 CI/CD 审查动作自动化。这意味着 AI 编程工具开始真正进入工程流程中...
vLLM升级0.17.1:MoE后端、Mamba缓存和MTP处理一起修,推理框架继续做细底层兼容
AI资讯vLLM 0.17.1 没有铺陈太多概念,直接把补丁落在推理底层:TRTLLM 的 MoE 路径、Mamba 和 Qwen3.5 的缓存块处理,以及 MTP 的索引优化都被列进官方说明。对跑推理服务的团队来说,这种版本往往比大而全的新功能更有用。 推理框架一旦进入复杂模型和异构后端,很多问题并不是“能不能跑”,而是某个后端、某种精度或某条缓存链路会不会在负载下出错。vLLM 这次就是针对这些细节...
CrewAI更新1.10.2a1:动态工具注入、并发锁问题和MCP解析一起修,代理框架更重稳定性
AI资讯CrewAI 这次更新把一组真正影响落地的问题凑到了一版里解决:一边新增动态工具搜索和更多 Brave Search 工具,另一边把多进程锁异常、并发结果聚合、MCP 解析和上下文传递问题一起修掉。对代理框架来说,这比多一个概念功能更关键。 官方 release notes 里还提到,GitPython 被升级用来修补路径遍历类安全问题,memory 类也做了可序列化重构。这说明 CrewAI ...
OpenHands升级1.5.0:仓库切换、任务看板和规划代理一起补位,开发代理开始更像完整工作台
AI资讯OpenHands 1.5.0 这次把几个关键缺口一起补上了:现有会话可切换仓库、右侧任务列表能实时看状态、聊天框里还能直接拉出技能和命令菜单。对长期跑开发任务的团队来说,这种改动比单纯多接一个模型更有价值,因为它直接影响代理是不是能被连续使用。 官方还在这一版加入了 planning agent、Bitbucket datacenter 支持,以及一批新模型接入,同时修掉了多项 UI 问题和依...
LangChain升级1.2.12:工具调用追踪更细了,框架迭代开始把调试体验做成默认能力
AI资讯LangChain 1.2.12 看起来是个小补丁,但它补的地方很关键:wrap model 和 tool call tracing。对日常在框架里接模型、挂工具、串工作流的团队来说,这种追踪能力往往比再加一个新组件更实用,因为它直接关系到排错速度。 官方 changelog 很短,却恰好点在开发者最常遇到的问题上——模型包裹层和工具调用层的可见性还不够细。LangChain 现在把 traci...
Google谈青少年生成式AI安全:先做年龄适配和防护,再把Gemini学习工具推向教育场景
AI资讯Google 这次围绕青少年生成式 AI 安全讲得很完整,重点不是一句“我们重视安全”,而是把年龄适配、隐私保护、内容限制、红队评测和学习工具一起摆上台面。对 AI 产品来说,这代表年轻用户场景开始进入更严格的产品设计阶段。 文章里提到,Google 会在模型与产品层面使用分类器和 safeguard 来限制不适龄内容,还会通过对抗测试和与儿童发展专家合作来发现新风险。它甚至点出了 2025 年...
MiniMax推出M2.1:多语言代码能力再抬升,办公复合指令和Agent工作流一起进化
AI资讯MiniMax 这次把 M2.1 的定位说得很清楚:不是只卷 Python,而是要把多语言编程、移动开发和办公室里的复合指令场景一起做好。这个方向很现实,因为企业和开发团队真正遇到的任务,本来就不是单一语言、单一页面和单一步骤。 官方文章里提到,M2.1 一口气强化了多种编程语言能力、Web/App 开发表现、复合约束执行,以及在各类编程工具和 Agent 框架里的泛化表现。同时它还强调响应更简...
OpenAI把计算机环境接进Responses API:代理不再只会回话,开始能在容器里真执行
AI资讯OpenAI 这次把计算机环境正式带进 Responses API,信号很明确:代理能力不再只靠函数调用拼起来,而是开始拥有能处理文件、运行命令和维持状态的执行空间。对开发团队来说,这比单纯增加一个工具接口更重要,因为它决定了 Agent 能不能真正承担连续任务。 文章把重点放在 agent runtime 的搭建方式上,包括 Responses API、本地 shell tool 和托管容器的...
YouTube扩大AI肖像识别试点:公众人物与记者进入保护范围
AI资讯YouTube 正在扩大 AI 肖像识别试点,把更多公众人物和记者纳入检测与申诉范围。相比一般内容治理更新,这次动作更直接地落在“深伪内容如何被发现、如何被处理”这个现实问题上。 平台侧这一步说明,AI 生成内容的治理已经从通用政策进入更细分的人群保护阶段。记者、政界人士和高曝光公众人物更容易成为伪造目标,因此平台需要更主动的检测和申诉机制,而不能只依赖事后举报。 这条更新值得关注,是因为它反...