AI资讯
LiteLLM发布v1.82.dev2:多模型接入与统一调用工具继续强化工程体验
AI资讯LiteLLM 发布 v1.82.dev2 版本,官方通过 GitHub Release 公布更新。作为多模型 API 适配与统一调用工具,LiteLLM 在开发者生态中的价值非常直接:帮助团队在不同模型供应商之间做更低成本的切换与管理,因此每次版本迭代都与真实开发效率密切相关。 从工具定位看,LiteLLM 处于模型接入层与调度层之间。新版本更新通常意味着接口兼容继续完善、接入...
llama.cpp发布b8234:本地大模型推理框架继续强化性能与部署适配
AI资讯llama.cpp 发布 b8234 版本,官方通过 GitHub Release 公布最新更新。作为本地大模型推理与量化生态中最核心的开源项目之一,llama.cpp 的版本迭代通常直接影响推理效率、模型兼容性与硬件适配能力,因此每次发布都会被开发者和本地部署用户密切关注。 从工具定位看,llama.cpp 并不面向普通用户,而是服务于模型运行、量化适配和本地推理场景。新版本更...
HunyuanImage 3.0-Instruct上线:原生多模态理解与高保真图像合成能力公布
AI资讯腾讯混元发布HunyuanImage 3.0-Instruct,定位为原生多模态的图片编辑与图像生成模型。公开信息称其基于80B参数的混合专家(MoE)架构,推理时约13B参数被激活,强调在理解输入图片与指令后进行推理,再输出高保真结果,以提升指令对齐与编辑一致性。 功能侧重点包括精确图片编辑与多图融合:可在尽量保持非目标区域不变的前提下,对指定对象进行添加、移除或修改;也可从多张图片抽取人物或...
DeepSeek V4发布时间与亮点流出:长代码提示词处理或成突破点
AI资讯据外媒1月9日报道,中国AI公司DeepSeek被指计划在2月中旬推出新一代旗舰模型V4,定位重点面向编程场景。报道援引知情人士称,V4在内部编码基准测试中表现突出,可能在部分编程任务上超过现有主流模型,并在处理“超长代码提示词”方面取得进展,有望更好支持大型代码库的理解、改写与排错。 目前DeepSeek尚未对发布时间、上下文长度上限、推理成本与可用形态作出公开确认,实际表现仍需等待正式发布后...
MiniMax开源MiniMax-M2.1权重:VIBE与Multi-SWE成绩领先,支持本地部署
AI资讯MiniMax发布并开放MiniMax-M2.1模型权重,采用Modified-MIT许可在Hugging Face提供下载,同时给出本地部署指引与常用推理框架配置建议。官方将其定位为面向真实世界软件开发与智能体工作流的模型更新,强调可控、可部署与更顺滑的交互体验。 在官方公开的基准表中,MiniMax-M2.1在Multi-SWE-bench取得49.4,超过Claude Sonnet 4.5...
通义万相Wan 2.6发布:角色扮演、智能分镜与15秒视频生成升级
AI资讯阿里巴巴发布通义万相2.6(Wan 2.6)系列模型,并在阿里云百炼等入口开放使用。新版主打“角色扮演”与可控叙事:可参考输入视频中的角色外观与音色,结合提示词生成单人、多人或人与物合拍视频,并可将简短提示词扩写为多分镜脚本,提升跨镜头连贯性与主体一致性。 在能力上,万相2.6强调更自然的音画同步与更稳定的多人对话,同时覆盖音乐与歌曲生成,并提供“音频驱动”用文本与音频带动多镜头演绎。公开视频信...
AQ升级蚂蚁阿福发布新版本,健康陪伴、健康问答、健康服务同步强化
AI资讯蚂蚁集团宣布旗下AI健康应用AQ完成品牌升级,更名为“蚂蚁阿福”,并推出App新版本。官方披露,“蚂蚁阿福”月活用户已超过1500万,产品定位从偏“AI工具”的健康问答,进一步转向“AI健康朋友”,强调长期陪伴与日常健康管理。 新版“蚂蚁阿福”围绕健康陪伴、健康问答、健康服务三方面升级,重点提升个人与家庭健康信息管理、健康问题交互,以及与在线问诊等服务资源的连接能力。蚂蚁集团同时提醒,AI输出不...
Google Translate 推出耳机实时语音翻译Beta:Gemini 语音到语音能力上线
AI资讯Google 宣布升级 Gemini 音频能力,并把“实时语音到语音翻译”以 Beta 形式推送到 Google Translate。该功能面向耳机使用场景,可在对话中进行实时翻译,并尽量保留说话者的语气、节奏与音高,让译文听感更接近原声表达。 目前该 Beta 先在 Android 端于美国、墨西哥、印度等地区分批开放,支持任意耳机,并覆盖70多种语言;iOS 版本预计在 2026 年扩展推出...
NotebookLM联合Nano Banana Pro上线Infographic与Slide Decks
AI资讯NotebookLM正式开放Infographic与Slide Decks功能,配合Nano Banana Pro与Gemini能力,用户可一键把资料变为信息图与演示文稿,覆盖学习、营销、汇报等高频场景,AI创作链路更顺滑、质量更稳定。 **一、这次更新到底给了什么能力** **1、从素材到成品:一键生成可讲述的结构** Infographic与Slide Decks结合NotebookL...
24小时AI新闻速览:国内密集落地AI场景,海外围绕算力泡沫与应用风险持续博弈
AI资讯在过去24小时内(2025年11月21日至11月22日),国内一方面从科普热词、产业场景到垂直小语种大模型多点开花,显示出“从热概念到真应用”的趋势;另一方面,海外围绕英伟达业绩、AI投资泡沫、教育与医疗等民生领域应用展开激烈讨论,也暴露出监管与安全上的新挑战。 **1、2025年度十大科普热词发布,大模型、人形机器人、智能体等入选** 中国科普作家协会发布2025年度十大科普热词,其中“大...
AI资讯
更多- 1 Boston Children’s 用 AI 推进罕见病诊断
- 2 Braintrust 用 Codex 加快客户需求验证
- 3 ComfyUI 接入 OpenRouter,创作工作流更灵活
- 4 PwC 扩大 Claude 部署,企业 AI 从试点走向业务单元
- 5 ChatGPT 接入个人财务预览,AI 开始进入真实账户场景
- 6 Gemini 进入 Android 版 Chrome,移动浏览器开始变成 AI 助手
- 7 MachinaCheck 展示制造业 Agent,用本地模型判断 CNC 可制造性
- 8 中国移动发布 AI-eSIM,手机号码可能变成智能体入口
- 9 纽约时报更正 AI 生成引文,新闻编辑流程再次拉响警报
- 10 Cerebras IPO 传超 20 倍认购,晶圆级芯片热度升温
AI百科
更多- 1 NotebookLM Audio Overview 是什么?资料变播客的原理
- 2 Claude Artifacts 是什么?把回答变成可预览作品
- 3 Gemini Deep Research 是什么?AI 如何做长报告
- 4 ChatGPT Canvas 是什么?为什么适合写作和代码
- 5 Perplexity Spaces 是什么?AI 搜索里的项目空间
- 6 Hermes Agent 消息网关是什么?远程助手靠它转发
- 7 Hermes Agent 是什么?和普通聊天机器人有何不同
- 8 Hermes Agent 记忆系统怎么理解?保存经验还是保存聊天
- 9 Hermes Agent MCP 是什么?为什么它能扩展工具
- 10 Hermes Agent Skills 是什么?它不是普通提示词