agent

OpenCLI 学习 08：现实约束与兼容层思路

ladydd

14 Apr 2026 — 3 min read

1. 我当前面对的现实约束

虽然我现在越来越倾向于：

上层做 Agent
下层做 Harness

但现实里调用我的人，很多时候只会通过 API 的形式来调用能力。

这意味着：

我未必能决定上层最终长成什么样
外部接入形式可能仍然是 HTTP、函数调用或者一次性接口

2. 我当前的重要判断

我现在认为，这并不和 Agent + Harness 的方向冲突。

更合理的理解是：

Agent + Harness 是内部核心结构
API、函数调用、HTTP 等形式是外部兼容层

也就是说，我真正需要先做好的是：

Agent 的能力设计
Harness 的抽象与落地
Agent 和 Harness 之间的接口关系

而不是一开始就被外部接入形式绑死。

3. 一个重要认识：不是 API 和 Agent 二选一

我当前更认可的分层是：

内部：Agent + Harness
外部：按现实需要外挂 API / HTTP / function-like interface

所以：

API 不需要消失
它只是退到系统最外层，变成接入和兼容形式

这让我不再需要把“是否还要支持 API”理解成和 Agent 路线冲突的问题。

4. 关于 Agent“灵魂”的担心

我也意识到一个重要担心：

Agent 最灵魂的部分之一，可能正是中间的 checkpoint、澄清提问和用户确认
如果最后被强行包成一次 HTTP 函数调用，这部分能力会被压缩掉

但我现在不打算一开始就被这个问题卡住。

我的当前选择是：

先按我自己的思路把核心做好
先把 Agent + Harness 这套结构做起来
之后如果现实需求要求我把它收敛成某种固定形式，再去外挂适配层

5. 我当前的态度

我不再要求系统一开始就“完美兼容所有未来形态”。

我更愿意先坚持：

核心结构要对
内部能力组织方式要对
真正有复利的部分要先沉淀出来

至于外面到底包成：

HTTP
函数
单轮接口
工作流节点
聊天式交互

这些都可以是后续适配层的问题。

6. 我当前的一句话总结

我现在更愿意先把自己的核心路线定为 Agent + Harness，把 API 或其他外部形态看成后挂的兼容层。即使未来现实需求要求我把能力收敛成一次 HTTP 或函数形式，也不影响我先把内部能力结构做对。

7. 暂时停在这里

当前阶段，我不再继续泛化思考。

下一次继续时，更适合进入的问题会是：

如何具体落地一个 harness。

把 Codex CLI 的登录态"搬"到一台新服务器

场景:你在一台老机器上早就登录好了 Codex CLI,现在开了台新服务器、装好了 codex,但它没登录。你不想在新机上重新走一遍 OAuth 网页授权(有时候服务器上根本打不开浏览器),只想把老机器上那份"已经登录好的身份"复制过去。这篇讲的就是这个搬运动作的完整方法论——为什么能搬、怎么搬、有哪些坑。命令里所有隐私都用占位符,照着换成你自己的即可。一、先理解一件事:Codex 的登录就是一个文件这是整个操作的地基。Codex CLI(ChatGPT OAuth 登录模式下)的登录状态,不在什么系统钥匙串里,也不在环境变量里,就是家目录下一个单独的 JSON 文件: ~/.codex/auth.json 它长这样(字段名是真的,值我打码了): { "auth_mode": "

哨兵机制:让 Agent 一触即醒

0. 一句话点破本质 **让"等"发生在便宜的子进程里,让贵的 agent 只在有事时醒。**心跳解决"最迟多久必有人查岗",探针解决"事情一发生几乎立刻有人到场"——两个机制回答的是两个不同的问题,谁也替代不了谁。 1. 机制全貌:会自杀的轮询进程 + 宿主的"尸体通知" 我的实现只有两块积木: 积木一:一个有明确死法的后台循环 # 放行任务的同时,后台挂上(run_in_background) for i in $(seq 1 20); do 信号=$(ssh data "tmux capture-pane -t dna

Agent 心跳机制·设计与实现

0. 一句话点破本质 **心跳不是闹钟,是"带着完整世界快照的自我唤醒"。**闹钟只解决"什么时候醒";心跳真正要解决的是你点出的那个问题——醒来的那个瞬间,清楚自己是谁、任务到哪了、这一跳该干什么。我所有跑得好的心跳,提示词都写得像给一个失忆的陌生人看的;所有出过事的心跳,都是因为假设"我还记得"。 1. 第一性原理:为什么"醒来知道干啥"这么难一个长期任务里的 agent 面临三重失忆: 1. 上下文会被压缩——多轮之后早期细节只剩摘要,心跳打进来时,那条心跳提示词可能是上下文里唯一高保真的任务描述 2. 世界在你睡着时变了——下属可能干完了、卡死了、跑偏了,你脑子里的"进度"从睡着那刻就开始过期 3. 任务本身会变—

我没手动映射 3000，公网为什么还能访问？一次 UPnP 误开孔复盘

写在前面：标题里的“自己打开”只是当时的主观感受。路由器没有失控，也不存在神秘穿透。真正发生的是：排障自动化从局域网主动调用了 UPnP AddPortMapping，路由器按协议新增了公网映射。 1. 原本的设计边界家里的 Open WebUI 跑在一台 Ubuntu 主机的 Docker 中：内网主机 192.168.x.x:3000 路由器上手动配置的入口是：公网 TCP 13000 → 内网主机:3000 外部用户不直接访问家宽端口，而是先到云端 Caddy：用户浏览器 → https://ai.example.com （云端 Caddy） → http://home.example.com:13000 （DDNS → 家宽公网