OpenClaw 心跳优化:从每天 $300 降到 $30 的实战记录
背景
我用 OpenClaw 跑了一套 AI agent 系统。主 agent(未然)用 Claude Opus,每 15 分钟触发一次心跳巡检。某天看 GoodVision 账单吓了一跳:
| 日期 | 花费 |
|---|---|
| 3⁄5 | $184 |
| 3⁄6 | $303 |
| 3⁄7 | $298 |
| 3⁄8 | $100 |
| 优化后 3⁄9 | *… |
Welcome to my personal blog! Here I share tech articles, life insights and interesting ideas.
我用 OpenClaw 跑了一套 AI agent 系统。主 agent(未然)用 Claude Opus,每 15 分钟触发一次心跳巡检。某天看 GoodVision 账单吓了一跳:
| 日期 | 花费 |
|---|---|
| 3⁄5 | $184 |
| 3⁄6 | $303 |
| 3⁄7 | $298 |
| 3⁄8 | $100 |
| 优化后 3⁄9 | *… |
你每次跟 AI 对话,都要把整段对话历史发给大模型。模型需要”读完”所有内容才能回复你。
问题来了:读一遍很贵。
大模型按 token(大约 0.75 个中文字 = 1 token)收费,”读”(输入)和”写”(输出)分…
简单说:Cache 就是”记住算过的东西,下次不用重新算”。
当你给 AI(比如 ChatGPT、Claude)发消息时,AI 需要先”读懂”你发的所有文字,这个过程很耗计算资源。如果你下次发的消息前半段和上次一…
本文记录了我在一台 Mac mini 上,用 OpenClaw + Docker + 本地 GPU 搭建多 Agent 协作系统的过程。不是教程,是实践笔记。
作为 SRE,我对工具的要求很简单:可控、可观测、能自托管。市面上的 AI Agent 平台大�…
JMS 是一个 Go 写的 JumpServer CLI 客户端,日常用于 SRE 运维。经过多轮迭代,已经具备了相当丰富的功能:WebSocket 终端、exec 单命令执行、SFTP 文件传输、Miller Column TUI 资产浏览器、AI Panel(通过 Claude API 在终端内提供 AI 辅…
我们用 LiteLLM 搭建了一个 LLM Proxy Gateway,通过 Kustomize 的 base + instances 结构在同一个 Kubernetes namespace 里部署多个实例,共享一个 PostgreSQL 做统一的 API key 管理和用量追踪:
| 实例 | 域名 | 上游 | Provider | |——|——|——|…
我有一个 Go 写的 JumpServer CLI 工具 (jms),内嵌了 AI Panel 功能,通过 Anthropic Claude API 在终端内提供 AI 辅助诊断。原本直连 Anthropic API 一切正常,但当我把请求路由到 LiteLLM 代理时,接连遇到了三个兼容性问题。
这些问题…
JMS 是一个 JumpServer CLI 客户端,通过 WebSocket 连接远程终端。最近在终端内嵌入了一个 AI Panel(Ctrl+] 唤起),让 Claude 能直接在终端会话中辅助诊断问题。
这篇文章拆解 AI 部分的核心设计:Agent Loop 如何运转、SSE 流式�…
我写了一个 JumpServer CLI 客户端 (jms-cli),通过 WebSocket 连接 JumpServer KOKO 终端。连接在大约 15-20 秒后必定断开,困扰了我很长时间。
KOKO 每 5 秒发送 WebSocket ping,客户端必须及时回复 pong。通过 pcap 抓包分析,发现 pong…
Testing PlantUML rendering:
@startuml
Alice -> Bob: Authentication Request
Bob --> Alice: Authentication Response
Alice -> Bob: Another authentication Request
Alice <-- Bob: Another authentication Response
@enduml