在新加坡、东京与美西 xxxMac Mac mini M4 上跑 OpenClaw 网关的值班同学,在重装 Node 或清空配置之前,需要一条「日志优先」的阶梯。 上游将 openclaw doctor 作为官方的健康检查、迁移与修复入口:人类用交互模式,跳板机用 --non-interactive,明确接受自动修复时用 --repair,怀疑重复网关服务时用 --deep。本文给出症状与命令映射、五分钟内的取证方式,以及与你在 macOS 上已使用的 LaunchAgent 模式对齐的恢复路径,并含七步初动循环、数值阈值及与令牌/升级文档一致的 FAQ。
openclaw gateway restart 连续失败 两 次后停止反复安装——先快照配置,将 doctor 输出重定向到文件执行一次,再考虑 升级与回滚手册 中的 semver 变更。
认证异常请对照 网关令牌与重启指南,标签漂移看 launchd 常驻服务指南,若 doctor 提示非预期的监听暴露请读 Webhook 入站加固。密钥卫生见 密钥管理指南。制度问题走 帮助中心,容量看 定价。
症状—命令矩阵(前 15 分钟)
| 你看到的 | 可能类别 | 首选命令 | 应附证据 |
|---|---|---|---|
| 网关端口已被占用 | 僵尸监听/重复安装 | openclaw doctor --deep |
前 40 行与 lsof -nP -iTCP:18789 |
| OAuth 或模型鉴权过期 | 凭据漂移 | openclaw doctor(交互) |
脱敏后的 doctor 摘要,勿贴生令牌 |
| CI 钩子报网关宕机 | 非交互路径 | openclaw doctor --non-interactive |
退出码与 UTC 时间戳 |
| 升级后出现配置合并警告 | 迁移积压 | openclaw doctor --repair |
修复前 tarball 的 SHA-256 |
在工单升级前值得 tail 的日志
| 来源 | 为何重要 | 建议 |
|---|---|---|
| doctor stdout/stderr | 工具改动了什么的一次叙事 | 按日期目录用 tee 落盘 |
| LaunchAgent stderr | GUI 看不到的崩溃循环 | 按标签过滤 log show --predicate |
| 网关访问日志片段 | 401 峰值与发布关联 | 仅保留最后 2000 行 |
七步初动循环
- 宣告渠道: 发布主机名、区域(新加坡、东京、美西)及是否影响生产流量。
- 采集基线: 运行
openclaw --version、node -v、sw_vers原样贴单,勿写散文总结。 - 健康检查: 在 Mac 上
curl -fsS http://127.0.0.1:18789/healthz(或你们文档中的路径),20 秒内 HTTP 200。 - 带着意图跑 doctor: 可弹 UI 时在 Web VNC 用交互;纯 SSH 自动化账号用
--non-interactive。 - 有界修复: doctor 提议迁移时先快照工作区根;
shasum -a 256tarball 后再--repair。 - 审慎回收 LaunchAgent: 按 launchd 指南 unload/reload;卡住时按令牌指南在 GUI 域使用
launchctl kickstart -k。 - 金丝雀: 发一条合成 Webhook 或工具调用,观察 15 分钟错误率,附 doctor 日志结案或升级。
发给厂商或内部群的内容
优质初报包含五项不变事实:区域 POP、OpenClaw CLI 的 semver 行、Node 补丁级别、完整 doctor 调用(含是否 --deep)、网关是否仅回环。勿贴生令牌或整环境导出——脱敏并附配置 tarball 的 SHA-256。蓝绿双网关时在线程标明 staging/生产工作区路径,避免修错 plist。doctor 建议删除孤立 LaunchAgent 前,对新旧标签各抓一份 launchctl print,让回滚可机械执行。
macOS 上 doctor 常揭的坑
针对网关令牌的 launchctl setenv 可能长于 shell 会话——doctor 会提示,排障指南说明如何安全清除。M4 统一内存压力下 CPU 未必先饱和:若提示 watchdog 重启,先查 memory_pressure。非交互 doctor 结束后若服务仍停,可再试一次网关启动;2026 上游对本地模式自动启动有收紧,但仍需验证,第二次失败请开单。
FAQ:标志位、令牌与自动化
何时用 --repair,何时用 --non-interactive?
无法交互的 CI/跳板先用 --non-interactive;快照配置后,若 doctor 仅列出你可整批接受的安全迁移,再用 --repair。二者都应配合显式验证网关重启。
doctor 能替代网关令牌排障吗?
不能。doctor 做配置规范化与端口冲突提示;缺失或轮换令牌仍需专用手册与 launchctl 恢复。
人类用 GUI 时,共享构建用户能跑 doctor 吗?
仅当按 共享主机卫生清单 做了账号隔离;无标签混用上下文会复现工作区串味案例,参见 staging 分轨指南。
把 openclaw doctor 当作第一工具而非最后手段,可缩短 Apple Silicon 云 Mac 的恢复时间,也与 xxxMac 独享 POP 带宽相匹配。doctor 常绿但产品行为回退时,扩大到应用日志与分阶段 semver;doctor 常红时,在配置备份完成前避免英雄式重装。需要隔离演练机?约五分钟从 控制台 开一台 Mac mini M4,先在上面跑通 doctor,再在命名维护窗推广到生产。
在可丢弃的 M4 上预演 doctor
控制台开一台干净 Mac mini M4,抓取 doctor 输出,再在指定窗口把同样步骤用于生产。