大型语言模型如何通过MCP协议调用外部工具？

AI导航

2025年7月12日

3 min read

1 次阅读

大型语言模型如何通过 MCP 协议调用外部工具？全面流程与实践指南

一、背景概述MCP（Model Context Protocol）是一项专为大型语言模型（LLM）设计的开放标准，解决了“模型如何安全、高效调用外部工具”这一核心难题。通过统一的 JSON-RPC 消息格式、可插拔传输层与清晰的角色分层，LLM 能够像插 USB-C 一样，即插即用各类工具或服务。

二、关键角色与职责

Host（主机）：创建并管理 Client，负责权限控制、配额与日志审计。
Client（客户端）：与单个 Server 建立 1:1 会话，转发消息并维护上下文。
Server（服务器）：封装具体工具（Tool），暴露可执行函数给外部调用。

三、调用外部工具的标准流程

能力发现
- Client 首次连接 Server，发送 mcp.listTools。
- Server 返回工具清单及 JSON Schema 描述，Host 可缓存结果。
任务规划
- LLM 读取工具列表与输入问题，决定调用顺序与参数。
- 若需要只读数据，先通过 mcp.getResource 获取上下文。

参数填充与调用

LLM 依据 Schema 生成调用参数，Client 打包成 JSON-RPC 请求：

{
  "method": "mcp.runTool",
  "params": {
    "name": "create_pull_request",
    "arguments": {
      "title": "Fix typo in README",
      "branch": "docs/typo-fix"
    }
  }
}

Server 验证 Scope 与参数后执行操作，并返回结构化结果。

结果处理与链式决策
- Client 将结果注入对话上下文。
- LLM 判断是否需要二次调用或结束任务。
- Host 记录调用链，便于审计与重放。

四、安全与治理机制

最小权限：每个工具限定细粒度 Scope，禁止越权写入。
输入输出校验：Server 端严格验证字段类型与长度，防止提示注入。
速率与成本控制：Host 设置令牌桶与调用预算，避免滥用。
审计日志：所有请求与响应持久化，支持回溯和异常排查。

五、性能与稳定性优化

会话复用：在同一连接内串行或并行调用，降低握手开销。
批量请求：将多次简单调用合并，减少网络往返。
重试与回退：设置幂等标识与指数退避，提升稳定性。
工具拆分：保证单个 Server 聚焦一类职责，方便水平扩容。

六、典型落地场景

智能代码助手：自动生成补丁、创建 PR、触发 CI。
企业客服 Agent：查询 CRM、生成工单、发送邮件。
运维自动化：实时监控指标，调用脚本修复故障。
数据分析流程：检索数据、生成可视化、推送报告。

七、实践建议

Schema 优先：先定义工具 Schema，再训练或对齐提示。
人类在环：为高风险操作增加审批步骤或二次确认。
持续迭代：通过日志分析改进提示模板与调用顺序。
端到端监控：链路埋点关键指标（延迟、成功率、成本），持续优化。

推荐工具

Microsoft Copilot

AI聊天

Microsoft Copilot 是微软推出的多模态 AI 助手，集成于 Windows、Microsoft 365、Edge 浏览器等平台，提供文本生成、语音交互、图像创作等功能。基于 GPT-4 和 Microsoft Graph，Copilot 能理解用户的自然语言指令，协助完成文档撰写、数据分析、邮件处理、代码编写等任务。用户可通过网页、桌面应用、移动设备访问 Copilot，提升工作效率与创造力。Copilot 还支持插件扩展，适用于个人用户与企业团队的多样化需求。

Meta AI

AI聊天

Meta AI是由Meta公司（原Facebook）开发的多模态人工智能助手，基于最新的Llama 4大语言模型构建，支持文本、图像、音频等多种输入形式。用户可通过Facebook、Instagram、WhatsApp、Messenger等平台，以及独立的Meta AI应用和Ray-Ban智能眼镜访问该助手。Meta AI具备强大的自然语言处理、图像生成、语音交互和代码编写能力，广泛应用于内容创作、办公自动化、编程辅助等场景。其“Imagine”功能可根据文本描述生成高质量图像，增强用户的创意表达。Meta AI致力于提供个性化、智能化的服务，提升用户在社交、工作和娱乐等方面的体验。

Gemini

AI聊天

Gemini是由Google DeepMind开发的下一代多模态人工智能助手，旨在提供集成文本、图像、音频、视频和代码处理能力的强大AI服务。自2023年12月推出以来，Gemini已成为Google生态系统的核心AI引擎，广泛应用于Gmail、Docs、Chrome、Photos等产品中。其最新版本Gemini 2.5 Pro引入了“Deep Think”模式，显著提升了复杂任务的推理和规划能力。Gemini支持多种交互方式，包括语音对话、图像生成、视频创作等，满足用户在办公自动化、内容创作、编程辅助等多方面的需求。通过API接口，开发者可将Gemini集成至各类应用中，打造个性化的AI解决方案。此外，Gemini还提供了Pro和Ultra订阅计划，解锁更高级的模型访问权限和功能，助力企业和个人用户实现更高效的工作流程。

Grok

AI聊天

Grok是由埃隆·马斯克创立的xAI公司开发的先进AI助手，旨在提供真实、直接且富有幽默感的对话体验。其最新版本Grok 3于2025年2月发布，利用xAI的Colossus超级计算平台，具备强大的推理、编程、视觉处理和实时搜索能力。Grok支持多模态输入，包括文本、图像和音频，能够生成图像、分析趋势，并通过“Think”和“Big Brain”模式处理复杂任务。该助手集成于X平台（原Twitter），并提供iOS、Android和网页端访问。此外，Grok已部署在微软Azure云平台，支持企业级API接入。

DeepSeek

AI聊天

DeepSeek是由杭州深度求索人工智能基础技术研究有限公司于2023年推出的人工智能平台，专注于开发高性能、低成本的大语言模型。其核心产品包括DeepSeek-R1和DeepSeek-V3，前者于2025年1月发布，后者于2024年12月发布，均在自然语言处理、数学推理和代码生成等任务中表现出色。DeepSeek支持多语言交互，提供网页、移动应用和API接口，适用于内容创作、办公自动化、编程辅助等多种场景。其模型采用开源策略，训练成本显著低于行业平均水平，推动了人工智能技术的普及和应用。

文心一言

AI聊天

文心一言（ERNIE Bot）是百度推出的生成式人工智能产品，基于自研的文心大模型（ERNIE）构建，具备强大的自然语言处理和多模态生成能力。该产品支持文本、图像、音频等多种输入形式，广泛应用于文学创作、商业文案撰写、数理逻辑推算、中文理解和多模态内容生成等场景。文心一言已集成至百度搜索、百度智能云等平台，并通过API接口向企业和开发者开放，助力各行业实现智能化升级。用户可通过网页版、移动应用等多种方式访问，享受高效便捷的AI服务。

通义千问

AI聊天

通义千问是阿里云推出的超大规模语言模型，具备强大的自然语言处理和多模态理解能力。该模型支持文本、图像、音频等多种输入形式，广泛应用于内容创作、办公自动化、编程辅助、翻译服务等多个场景。通义千问已集成至钉钉、天猫精灵等阿里产品中，并通过API接口向企业和开发者开放，助力各行业实现智能化升级。用户可通过网页版、移动应用等多种方式访问，享受高效便捷的AI服务。

讯飞星火

AI聊天

讯飞星火是科大讯飞推出的新一代认知智能大模型，具备跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务。该模型拥有多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情境式思维链逻辑推理、多题型可解析数学能力、多功能多语言代码能力和多模态输入和表达能力等七大核心能力。讯飞星火已广泛应用于教育、办公、医疗、工业、汽车等多个领域，支持PC、iOS、安卓、小程序和H5等主流系统平台，满足用户在不同场景下的智能化需求。

Mistral AI

AI聊天

Mistral AI是一家总部位于法国巴黎的人工智能公司，专注于开发开放权重的大型语言模型（LLM）。其产品组合包括Mistral 7B、Mixtral 8x7B、Mistral Medium、Mistral Large等，支持多语言处理、代码生成和复杂推理任务。Mistral AI提供的“Le Chat”是一款多语言、多模态的AI助手，具备网页搜索、图像生成和实时更新功能，适用于内容创作、办公自动化和编程辅助等场景。此外，Mistral AI的“La Plateforme”平台允许企业自定义、微调和部署AI模型，支持边缘计算和本地部署，确保数据隐私和安全。公司致力于通过开放和创新的方式，推动人工智能技术的普及和应用。

大型语言模型如何通过MCP协议调用外部工具？

相关文章

大模型和小模型的本质区别及适用场景分析

什么是RAG？RAG技术在企业知识管理中的应用实践

什么是 ChatGPT？全面解析其原理、功能与应用场景

什么是Tokens？语言模型是如何输出Tokens的？

什么是大模型的“概率”和“温度值”？

提示词写作指南：五步打造高质量Prompt

推荐工具

Microsoft Copilot

Meta AI

Gemini

Grok

DeepSeek

文心一言

通义千问

讯飞星火

Mistral AI

AI资讯

AI百科