fastmcp 学习

https://github.com/jlowin/fastmcp

这篇文章是我学习 FastMCP 的一次系统整理:从 MCP 到 FastMCP 的组件设计,再到 Provider、Transform、Context、任务与部署方式。目标是把零散笔记变成一条能走通的理解路径。


1. 我先把 MCP 讲清楚:它解决的到底是什么问题?

很多时候 AI “会想”,但它不会“做”。

  • 想查数据库
  • 想调用内部 API
  • 想发邮件或写文件

如果没有一套标准的协议,AI 客户端(Claude、Cursor 等)就很难稳定、安全、可扩展地调用你提供的能力。

MCP(Model Context Protocol)就是这套标准协议

  • 客户端用统一的方式发起调用请求
  • 服务器用统一的方式暴露工具、资源和提示词
  • 中间靠 JSON-RPC 通信
┌─────────────────┐         JSON-RPC          ┌─────────────────┐
│   AI 客户端      │ ◄─────────────────────► │   MCP 服务器     │
│ (Claude/Cursor) │                           │  (你写的代码)    │
└─────────────────┘                           └─────────────────┘

我更愿意把它理解成:“AI 时代的工具接口规范”


2. FastMCP 最舒服的点:几乎零配置,把函数变成工具

FastMCP 让我觉得设计很顺的地方在于:它会自动读取函数的 docstring 作为工具描述,AI 在 list_tools() 里看到的就是这段说明。

@mcp.tool
def search_database(query: str) -> str:
	"""搜索数据库"""
	return f"搜索结果: {query}"

这背后意味着:

  • 你只需要把 Python 函数写好
  • 类型注解负责生成 schema
  • docstring 负责给 AI “看懂”这个工具

2.1 description 的优先级

如果你在装饰器里手动写了 description,它会覆盖 docstring:

@mcp.tool(description="手动描述,会覆盖 docstring")
def search_database(query: str) -> str:
	"""这个 docstring 不会被用"""
	return f"搜索结果: {query}"

我自己的习惯是:

  • 大多数时候只写 docstring
  • 需要更强的提示效果时再加 description

3. 三类组件:Tool / Resource / Prompt

FastMCP 把“暴露给 AI 的东西”拆成了三类,我按最常用到最少用排序:

3.1 Tool:需要执行动作(最常用)

Tool = AI 要“干活”。典型是有副作用的事情。

@mcp.tool
def send_email(to: str, body: str) -> str:
	"""发送邮件"""
	return "已发送"

3.2 Resource:只读上下文

Resource = AI 要“看资料”,不执行动作。

@mcp.resource("docs://api-guide")
def api_guide() -> str:
	"""API 使用指南"""
	return open("api_guide.md").read()

3.3 Prompt:预设工作模板

Prompt = 给 AI 的指令模板,单体使用频率不高,但在多 agent、规范化工作流时可能更有价值。


4. 从“写一个 @mcp.tool”到“AI 真正调用成功”:调用链怎么走?

理解调用链能帮我定位很多问题,比如:为什么工具没被注册?为什么参数 schema 不对?为什么调用返回异常?

我用一句话概括:

装饰器阶段把函数注册成组件;运行时根据 name 查组件并执行原始函数;最后把结果包装成 MCP 返回格式。

4.1 装饰器阶段(服务启动时)

@mcp.tool
def add(a: int, b: int) -> int:
	"""加法计算"""
	return a + b

发生的事大致是:

  1. 解析函数名、docstring、类型注解
  2. 生成 schema
  3. 注册进 LocalProvider 的组件容器(类似字典)

4.2 AI 调用阶段(运行时)

  • AI 发起 tools/call
  • server 路由到 call_tool
  • provider 根据 name 找到 tool
  • 执行原始函数
  • 包装返回

5. Provider:工具不一定要手写

我之前以为 “工具 = 我写的 @mcp.tool”,后来发现 Provider 的设计把工具来源打开了。

  • LocalProvider:你手写函数(默认)
  • OpenAPIProvider:把 REST API 直接变成工具
  • ProxyProvider:代理另一个 MCP 服务,复用对方工具集

这个抽象很关键:工具是一种“能力描述”,能力可以来自不同系统


6. Transform:在暴露给 AI 前做“加工”

Transform 的感觉有点像中间件,但它作用在“组件层”。我常见的用法是:

  • 加命名空间:避免命名冲突(例如 api_search vs local_search
  • 过滤工具:只暴露符合 tag 的工具
  • 鉴权/可见性控制:按用户权限隐藏敏感能力

7. Context:让工具执行过程“可解释、可追踪”

工具不是只能返回一个结果。执行过程中如果能告诉 AI 当前在做什么,交互体验会好很多。

@mcp.tool
async def search(query: str, ctx: Context) -> str:
	await ctx.info("正在连接数据库...")
	await ctx.report_progress(50, 100)
	return "结果"

我的理解:

  • Context 是工具与系统对话的接口
  • 它让工具“边做边说”,而不是沉默地等最终结果

8. 依赖注入:把敏感依赖藏在工具后面

把数据库连接、鉴权、API key 这些东西放进工具参数里是危险的。

FastMCP 的 Depends 注入让我觉得很舒服:

def get_db():
	return Database(os.environ["DATABASE_URL"])

@mcp.tool
def query(sql: str, db = Depends(get_db)) -> str:
	return db.execute(sql)

AI 调用时只需要提供 sqldb 由系统注入。


9. 后台任务(Tasks):长耗时操作不要阻塞

如果某个工具要跑 1-5 分钟(生成报告、视频渲染、批处理),同步等结果会让体验变差。

@mcp.tool(task=True)
async def generate_report(data: str) -> str:
	"""生成报告"""
	return "报告完成"

工具元信息会告诉 AI:这个工具支持后台模式,客户端可以选择异步调用并轮询状态。


10. Transport:怎么部署、怎么连

我目前最常用的选择是:

  • stdio:本地集成(Claude Desktop、Cursor 常用)
  • http:远程部署(服务器上跑)

协议本质是 JSON-RPC,只是“跑在哪条管道上”的区别。


11. 这次学习我留下的结论

如果只用一句话总结 FastMCP:

它把“写 Python 函数”升级成“给 AI 暴露可调用的能力”,并且把元信息、通信、组织方式都标准化了。

我自己做 MCP 工具/Agent 项目时,会优先用:

  • Tool + docstring(先跑通)
  • Depends(把依赖收进去)
  • Provider/Transform(再扩展到复用与治理)
  • task=True(长任务体验优化)

Read more

三台机器部署 ClickHouse 高可用集群实战记录

本文是一份可发布版部署记录。真实 IP、域名、账号、密码、下载链接、业务目录名、机器唯一标识等敏感信息已经替换为占位符。命令中的 <...> 需要按自己的环境替换。 目标与拓扑 这次目标是用三台数据节点部署一套 ClickHouse 高可用集群,拓扑采用: 1 shard x 3 replicas 含义是:集群只有一个逻辑分片,三台机器都保存同一份数据的完整副本。任意一台数据节点宕机时,只要 ClickHouse Keeper 仍然有多数派,剩余节点仍可继续提供读写服务。 规划节点如下: 主机名示例地址角色ch-01<ch-01-ip>ClickHouse Server + ClickHouse Keeperch-02<ch-02-ip>ClickHouse Server + ClickHouse Keeperch-03<ch-03-ip&

By ladydd

折腾记(二):接入火山引擎实时语音 API,家庭语音助手体验直接拉满

接上篇 上一篇用全开源组件(Whisper + Hermes + Edge-TTS)搭了个语音助手,能跑,但体验就是"能用"二字: * 中文识别只有 70 分,方言基本歇菜 * 英文唤醒词"Alexa"喊着别扭 * 说完到回复要等 4-8 秒 * 它说话的时候你插不了嘴 这些问题靠堆开源组件很难根治。于是我去试了火山引擎(字节跳动)的语音服务,结果直接换了条路。 这篇分两段:先讲怎么用火山引擎的 ASR/TTS 替换掉开源组件(小改),再讲怎么上端到端实时语音模型(大改)。 第一段:先把 ASR 和 TTS 换成火山引擎 为什么换 我用豆包输入法的时候发现它语音识别准得离谱。一查,豆包用的就是字节自家的火山引擎 Seed-ASR。开通后有免费额度(

By ladydd

折腾记(一):用全开源组件给家里搭一个语音助手,对接自己的 Hermes Agent

起因 事情是从一块 ESP32-S3 开发板开始的。 我手上有一块 Seeed Studio XIAO ESP32-S3 Sense,带摄像头和麦克风。最初的想法很美好:用这块板子做一个无线语音终端,对着它说话,连到我服务器上跑的 Hermes Agent(一个自托管的 AI agent),让它回答我。 但折腾到一半我突然意识到一件事:我的麦克风、音响、服务器全在家里,为什么要绕一圈用 ESP32?直接把麦克风和音响插到服务器上不就行了? ESP32 那条路(做无线拾音终端)当然也有价值,但那是"为了学嵌入式而学",不是解决问题的最短路径。于是这个项目就从"嵌入式项目"变成了"在服务器上拼一个语音助手"。这篇就记录后者。 教训零:先想清楚你要解决的是什么问题。很多时候最优解比你最初设想的简单得多。 目标

By ladydd

Kiro 的三种代理设置方法:本地、服务端、Remote

作为kiro的骨灰级用户,这篇是我自己折腾 Kiro / Kiro Remote / Ubuntu Server 代理问题后的复盘。 核心不是“怎么配一个代理”,而是先判断:到底是谁在访问外网? 谁访问外网,代理就要配给谁。 0. 先说结论 Kiro 相关代理大概分三类: 场景真正访问外网的进程在哪里代理应该配在哪里本地 KiroWindows / Mac 本机本机 Clash / Proxifier / 系统代理服务端 Kiro / CLIUbuntu Server 上的 shell、CLI、node、kiro 进程Ubuntu 的环境变量,比如 HTTP_PROXY / HTTPS_PROXYKiro Remote远程 Ubuntu 上的 ~/.kiro-server 和 extensionHost远程 Ubuntu 的 Kiro Server

By ladydd
陕公网安备61011302002223号 | 陕ICP备2025083092号