标签:LLM

Qwen3 MLX 与 LLaMA3 MLX 性能对比:谁更适合本地推理?

AI资讯

**Qwen3 模型推出 MLX 格式:支持 4bit/6bit/8bit/BF16 多级量化,优化 Apple Silicon 体验** 2025 年 6 月,阿里巴巴 Qwen 团队宣布正式发布 Qwen3 系列模型的 MLX 格式版本。此次发布支持 4bit、6bit、8bit 与 BF16 四种量化级别,全面适配 Apple Silicon 平台,满足不同精度与性能需求。 **什么是 ...

AI导航 12

什么是向量库?如何构建支持大模型的语义搜索系统

AI百科

**什么是向量库?它与大模型的关系详解** **一、向量库是什么?** 向量库(Vector Database)是一种用于存储和检索高维向量数据的数据库系统。它的核心功能是根据“相似度”进行搜索,而不是传统的关键词匹配。这些向量通常由大语言模型(LLM)或嵌入模型将文本、图像等数据转化而来。 向量是模型将信息编码成的一组高维数字表示。例如,一段文本可能被转换为一个包含 768 个维度的向量。...

AI导航 14

什么是MCP(Model Context Protocol)?

AI百科

**MCP:大型语言模型中的 Model Context Protocol 协议详解** **一、什么是MCP(Model Context Protocol)?** 在大语言模型(LLM)领域,MCP 是 Model Context Protocol 的缩写,是一种用于**语言模型与外部系统交互**的开放通信协议。该协议由 Anthropic 于 2024 年提出,旨在解决模型无法访问动态数据...

AI导航 18

从零开始掌握Prompt Engineering:新手入门必读

AI百科

**什么是 Prompt Engineering?提示工程的定义、技巧与应用场景详解** 在大语言模型(LLM)快速发展的背景下,Prompt Engineering(提示工程)成为提升模型性能的关键技术。本文将深入解析提示工程的概念、常用技巧和实际应用,帮助读者全面理解这一新兴领域。 **一、提示工程的定义** 提示工程是指设计和优化输入提示(Prompt)的过程,以引导生成式 AI 模型...

AI导航 14

什么是RAG?RAG技术在企业知识管理中的应用实践

AI百科

**什么是RAG?检索增强生成的原理与应用详解** 在大语言模型(LLM)广泛应用的今天,如何提升其输出的准确性和时效性成为关键问题。RAG(Retrieval-Augmented Generation,检索增强生成)技术应运而生,旨在通过引入外部知识库,增强LLM的生成能力。本文将深入解析RAG的定义、工作原理、优势以及应用场景,帮助读者全面理解这一前沿技术。 **一、RAG的定义** R...

AI导航 12