标签：LLM

Qwen3 MLX 与 LLaMA3 MLX 性能对比：谁更适合本地推理？

**Qwen3 模型推出 MLX 格式：支持 4bit/6bit/8bit/BF16 多级量化，优化 Apple Silicon 体验** 2025 年 6 月，阿里巴巴 Qwen 团队宣布正式发布 Qwen3 系列模型的 MLX 格式版本。此次发布支持 4bit、6bit、8bit 与 BF16 四种量化级别，全面适配 Apple Silicon 平台，满足不同精度与性能需求。 **什么是 ...

AI导航 • 2025年6月16日 • 12

什么是向量库？如何构建支持大模型的语义搜索系统

AI百科

**什么是向量库？它与大模型的关系详解** **一、向量库是什么？** 向量库（Vector Database）是一种用于存储和检索高维向量数据的数据库系统。它的核心功能是根据“相似度”进行搜索，而不是传统的关键词匹配。这些向量通常由大语言模型（LLM）或嵌入模型将文本、图像等数据转化而来。向量是模型将信息编码成的一组高维数字表示。例如，一段文本可能被转换为一个包含 768 个维度的向量。...

AI导航 • 2025年5月31日 • 14

什么是MCP（Model Context Protocol）？

AI百科

**MCP：大型语言模型中的 Model Context Protocol 协议详解** **一、什么是MCP（Model Context Protocol）？** 在大语言模型（LLM）领域，MCP 是 Model Context Protocol 的缩写，是一种用于**语言模型与外部系统交互**的开放通信协议。该协议由 Anthropic 于 2024 年提出，旨在解决模型无法访问动态数据...

AI导航 • 2025年5月26日 • 18

从零开始掌握Prompt Engineering：新手入门必读

AI百科

**什么是 Prompt Engineering？提示工程的定义、技巧与应用场景详解** 在大语言模型（LLM）快速发展的背景下，Prompt Engineering（提示工程）成为提升模型性能的关键技术。本文将深入解析提示工程的概念、常用技巧和实际应用，帮助读者全面理解这一新兴领域。 **一、提示工程的定义** 提示工程是指设计和优化输入提示（Prompt）的过程，以引导生成式 AI 模型...

AI导航 • 2025年5月25日 • 14

什么是RAG？RAG技术在企业知识管理中的应用实践

AI百科

**什么是RAG？检索增强生成的原理与应用详解** 在大语言模型（LLM）广泛应用的今天，如何提升其输出的准确性和时效性成为关键问题。RAG（Retrieval-Augmented Generation，检索增强生成）技术应运而生，旨在通过引入外部知识库，增强LLM的生成能力。本文将深入解析RAG的定义、工作原理、优势以及应用场景，帮助读者全面理解这一前沿技术。 **一、RAG的定义** R...

AI导航 • 2025年5月25日 • 12

标签：LLM

Qwen3 MLX 与 LLaMA3 MLX 性能对比：谁更适合本地推理？

什么是向量库？如何构建支持大模型的语义搜索系统

什么是MCP（Model Context Protocol）？

从零开始掌握Prompt Engineering：新手入门必读

什么是RAG？RAG技术在企业知识管理中的应用实践

AI资讯

AI百科