05｜pi-agent-core：闭环、回灌与“继续/停止”到底谁说了算

ladydd

01 Apr 2026 — 2 min read

这篇写什么

聚焦 pi-agent-core 最关键的运行机制：tool loop（闭环）与工具结果回灌，以及 runtime 如何决定“继续下一轮还是结束”。

先说结论：tool loop 才是 agent

pi-agent-core 的核心不是“支持 tool calling”，而是把 tool calling 变成 tool loop：

模型提出工具调用
-> runtime 执行工具
-> 工具返回结果
-> 结果回灌上下文
-> 再次调用模型
-> 判断是否继续

只要这条链路成立，系统才真正像 agent；否则只是“会发工具意图的聊天模型”。

什么叫“回灌上下文”

回灌上下文就是：把工具执行得到的外部结果，作为正式历史消息写回到模型下一轮可见的上下文里。

为什么必须这么做？

模型并不直接生活在外部世界，只能看见上下文
工具执行发生在模型外部，如果结果不进入上下文，模型就无法基于结果继续决策

所以回灌不是字符串拼接技巧，而是闭环成立的中心机制。

“继续还是结束”谁来决定

关键点：不是模型单独决定，而是 runtime 决定。

模型会给出信号（例如产生 tool call、自然结束、长度截断、错误等），但“要不要继续下一轮”是 runtime 的裁决。

runtime 常见判断依据

是否出现工具调用

有工具调用：通常意味着任务还没完成，应执行工具并回灌后继续

stop reason（结束原因）

正常停止：通常可结束
工具调用停止：通常应继续
长度截断：可能需要补救或总结
错误/中断：通常中止或交给上层策略处理

工具执行是否成功

工具失败时：回灌错误给模型让其改策略，或按策略重试/终止

运行时护栏

最大轮次、最大工具次数、最大连续错误数等

一个最小可用闭环（施工版）

最小闭环通常至少包含：

接收任务输入
组织上下文
调用模型
解析模型输出
若有工具调用：执行工具
将工具结果作为正式消息回灌
再次调用模型
根据策略判断停止并返回

小结

pi-agent-core 更像调度器/状态机控制器：它不“替模型思考”，但让模型提出的动作意图能够被执行并回流为下一轮输入，最终形成可收敛的任务闭环。

banan2 对比 wan2.7 pro

阿里的新发的版本，用同样的图+同样的提示词进行两个模型的测试三联图：输入图-banana图-wan2.7pro 图

LTX-2.3 本地部署完整复盘

先把结论放前面：LTX-2.3（22B）这条 pipeline 在 4×RTX 3090（24GB）这套硬件上，按官方默认推理方式基本跑不起来。我最终得到的不是“没跑通”，而是一个更有价值的结果：把它为什么跑不起来、卡在哪、该怎么判断“物理不可行”，完整验证了一遍。这篇文章是一次本地部署的工程复盘：从模型文件下载、依赖链补齐、环境和代码层踩坑，到显存拆分、多卡 device 规划，再到最终 OOM 的边界判断。希望你在遇到类似“看起来只要把权重放进去就能跑”的大模型工程时，可以少走很多弯路。 TL;DR（1 分钟读完） * LTX-2.3 不是单模型，而是一个多组件 pipeline：文本编码器（Gemma）+ 视频 diffusion 主模型（

一次 generate-prompts 服务连续超时事故的完整排查记录

背景一个平时很稳定的服务，在 2026-04-02 这天突然出现“连续失败”。最让人难受的不是失败本身，而是失败信息太少：日志里只有一串「第 1 次请求失败」，没有异常类型、没有耗时、没有栈。这种时候人的直觉会把怀疑撒向四面八方：逻辑是不是坏了、参数是不是不对、上游是不是抽风、网络是不是波动……但没有证据，一切都只是猜。 1. 先把故障“照亮”：只补日志，不动行为线上系统已经跑了很久，第一原则是：先让问题可见，但不要一上来就改主逻辑。我加的日志只做两件事： * 把“这次请求到底发生了什么”讲清楚 * 保持所有行为不变（重试次数、超时、请求参数、返回解析都不动）具体补充项包括： * 请求开始时的关键信息（目标地址、超时、参数摘要、prompt 长度） * 当前是第几次重试、总重试次数 * 每次请求耗时

快手 KAT-Coder-Pro V2 模型测试

市面上几乎没人聊这个模型，反倒让我很好奇，我决定全面测评使用一下 StreamLakeStreamLake溪流湖是快手toB视频云平台，提供领先的音视频AI解决方案。包含KAT-Coder智能编程助手、万擎大模型平台、视频云服务、直播云、点播云、实时音视频RTC等产品。基于前沿AI技术和音视频算法，为企业提供智能代码生成、视频处理、内容理解、智能审核等全链路服务，助力数字化转型。StreamLakeStreamLake 付完款发现上下文只有256K , 到今天来说已经落后了而且不支持视觉，也没有mcp接入联网搜索之类的东西确实是远远落后了时隔半年再次看快手模型的官网，发现现在几乎就主打这一个模型了 coding plan用这个，然后api 调用这个是，接入openclaw 也是这个，总之一个模型走天下，看上去太穷了，像是随时跑路的状态，但其实我很喜欢这种方式, 一个模型通杀所有场景哈哈哈接入 opencode 中使用开了一个新的项目，决定保守一点，先让写文档，之后再生成代码下面是实际的体验 1. 不断 chat