agent

OpenCLI 学习 01：项目总览与核心问题

ladydd

14 Apr 2026 — 2 min read

1. 我最开始看到的现象

这个仓库根目录下有很多不同的软件目录，例如：

gimp/
blender/
libreoffice/
drawio/
zotero/

所以它不是单一应用，而是一个多软件、多 harness 的总仓库。

2. 项目在做什么

我目前的理解：

CLI-Anything 想把原本主要通过 GUI 使用的软件，整理成 Agent 也能稳定调用的 CLI 接口。

它不是简单做几个命令，而是在做一套标准化的软件能力接入方案。

3. 这里的 CLI 到底是什么意思

我一开始容易把 CLI 理解成“黑框里的自由互动”。

后面逐渐明确：

终端/黑框：只是运行环境
CLI：是能力暴露出来的命令接口
脚本：是实现 CLI 的一种方式

所以这里的 CLI 更接近“面向终端的函数调用接口”。

例如：

cli-anything-gimp project new --width 800 --height 600

它不是自由聊天，而是在调用一个被明确组织好的能力。

4. 为什么会让我联想到 REST API

因为两者本质上都在做“能力暴露”：

REST API：通过 HTTP 暴露能力
CLI：通过命令行暴露能力

区别在于：

API 更偏网络服务
CLI 更偏本地软件、本机工具、桌面应用

这个项目选择 CLI，不是因为 CLI 比 API 更高级，而是因为很多真实软件并没有天然的 REST API，但有脚本接口、命令参数、批处理模式或插件机制。

5. 这个项目真正统一的是什么

不是统一所有软件的功能本身，而是统一：

软件能力如何暴露给 Agent
CLI 应该如何组织
文档、测试、打包怎么做
Skill 怎么告诉 Agent 何时调用、如何调用

所以它更像是在统一一种“接入规范”和“工程方法”。

6. 当前我的一句话理解

CLI-Anything 的核心目标，是把复杂软件或复杂能力系统化地整理成可被 Agent 调用的命令树接口。

7. 当前我的疑问是如何逐步被澄清的

我最初模糊的是：

CLI 到底是不是黑框互动
这个项目到底是在做命令行工具，还是在做更大的东西
Agent 到底靠什么知道何时调用这些工具

当前得到的阶段性答案：

CLI 不是黑框互动，而是能力接口
这个项目不只是做 CLI，而是在做以 CLI 为形态的 harness
Agent 主要通过 SKILL.md、命令树、帮助信息、JSON 输出理解和使用这些 harness

把 Codex CLI 的登录态"搬"到一台新服务器

场景:你在一台老机器上早就登录好了 Codex CLI,现在开了台新服务器、装好了 codex,但它没登录。你不想在新机上重新走一遍 OAuth 网页授权(有时候服务器上根本打不开浏览器),只想把老机器上那份"已经登录好的身份"复制过去。这篇讲的就是这个搬运动作的完整方法论——为什么能搬、怎么搬、有哪些坑。命令里所有隐私都用占位符,照着换成你自己的即可。一、先理解一件事:Codex 的登录就是一个文件这是整个操作的地基。Codex CLI(ChatGPT OAuth 登录模式下)的登录状态,不在什么系统钥匙串里,也不在环境变量里,就是家目录下一个单独的 JSON 文件: ~/.codex/auth.json 它长这样(字段名是真的,值我打码了): { "auth_mode": "

哨兵机制:让 Agent 一触即醒

0. 一句话点破本质 **让"等"发生在便宜的子进程里,让贵的 agent 只在有事时醒。**心跳解决"最迟多久必有人查岗",探针解决"事情一发生几乎立刻有人到场"——两个机制回答的是两个不同的问题,谁也替代不了谁。 1. 机制全貌:会自杀的轮询进程 + 宿主的"尸体通知" 我的实现只有两块积木: 积木一:一个有明确死法的后台循环 # 放行任务的同时,后台挂上(run_in_background) for i in $(seq 1 20); do 信号=$(ssh data "tmux capture-pane -t dna

Agent 心跳机制·设计与实现

0. 一句话点破本质 **心跳不是闹钟,是"带着完整世界快照的自我唤醒"。**闹钟只解决"什么时候醒";心跳真正要解决的是你点出的那个问题——醒来的那个瞬间,清楚自己是谁、任务到哪了、这一跳该干什么。我所有跑得好的心跳,提示词都写得像给一个失忆的陌生人看的;所有出过事的心跳,都是因为假设"我还记得"。 1. 第一性原理:为什么"醒来知道干啥"这么难一个长期任务里的 agent 面临三重失忆: 1. 上下文会被压缩——多轮之后早期细节只剩摘要,心跳打进来时,那条心跳提示词可能是上下文里唯一高保真的任务描述 2. 世界在你睡着时变了——下属可能干完了、卡死了、跑偏了,你脑子里的"进度"从睡着那刻就开始过期 3. 任务本身会变—

我没手动映射 3000，公网为什么还能访问？一次 UPnP 误开孔复盘

写在前面：标题里的“自己打开”只是当时的主观感受。路由器没有失控，也不存在神秘穿透。真正发生的是：排障自动化从局域网主动调用了 UPnP AddPortMapping，路由器按协议新增了公网映射。 1. 原本的设计边界家里的 Open WebUI 跑在一台 Ubuntu 主机的 Docker 中：内网主机 192.168.x.x:3000 路由器上手动配置的入口是：公网 TCP 13000 → 内网主机:3000 外部用户不直接访问家宽端口，而是先到云端 Caddy：用户浏览器 → https://ai.example.com （云端 Caddy） → http://home.example.com:13000 （DDNS → 家宽公网