若把 OpenClaw 当成「又一个 Node 应用」,运维会在痛苦中学到:网关状态横跨磁盘上的 JSON5、LaunchAgent plist、工作区目录树,以及绝不能出现在截图里的密钥。 本 2026 手册为 xxxMac Mac mini M4 上的 SRE 与独立开发者提供可复现的备份范围、校验和习惯、恢复顺序与错误编辑后的回滚护栏。文中包含制品清单表、九个有序步骤、日志与磁盘数值阈值,以及与 doctor 与日志分诊手册、网关升级与回滚指南 对齐的常见问题。自动化上传前请先阅读 密钥管理指南。
在网关漂移变得不可恢复之前出现的痛点信号
- 两名工程师同一下午经不同 SSH 会话编辑
openclaw.json;无人知晓运行中网关解析的是哪一版。 - LaunchAgent 标签
ai.openclaw.gateway(或你文档中的等价名)重启干净,但频道仍离线,因为工作区路径被移动。 - 追 webhook 重试时调试日志暴涨,36 小时 内触发磁盘告警——在 chmod 777 之前先对照 入站加固 排查。
- 依赖 GUI 的修复停滞,因无人预约 Web VNC,而无头
ssh编辑又弄坏了 JSON5 逗号。
备份制品清单(bundle 应包含什么)
| 制品 | 典型路径提示 | 是否纳入 | 说明 |
|---|---|---|---|
| 网关配置 | ~/.openclaw/openclaw.json |
是(脱敏) | JSON5 允许注释——为解析一致性请逐字保留 |
| LaunchAgent plist | ~/Library/LaunchAgents/ |
是 | 工单中附带 launchctl print 输出 |
| 工作区人设 | 工作区 IDENTITY.md 等 |
是 | 排除网关未引用的本地实验 |
| 原始环境导出 | shell 历史 | 否 | 从保险库重建;备份历史有毒 |
恢复风险矩阵(症状 → 首选动作)
| 症状 | 首选动作 | 升级条件 |
|---|---|---|
| plist 加载后网关立即退出 | 用上游工具校验 JSON5;恢复最近已知良好的 tarball | 15 分钟 内连续两次恢复失败 |
| 频道已连接但工具挂起 | 检查工作区挂载与空闲磁盘 >12 % | 统一内存压力红色持续 >20 分钟 |
| 恢复后 Webhook 返回 401 | 对照保险库修订比对签名密钥 | 密钥已轮换但网关仍提供陈旧 HMAC |
九步备份—恢复演练(每季度至少一次)
- 冻结变更:在聊天中宣布 20 分钟 变更冻结;演练中途暂停从 ClawHub 指南 安装技能。
- 记录版本:记下
openclaw --version(或文档中的 CLI)、Node 主版本与 macOS 构建号。 - 复制配置:将
openclaw.json拷到带日期的目录,并在工单记录sha256sum。 - 导出 plist:归档 LaunchAgent plist,并保存
launchctl list中对网关标签的 grep。 - 打包工作区子集:纳入 Markdown 人设与工具配置;若 lockfile 可复现则排除
node_modules。 - 离线校验:在笔记本上用与网关相同主版本的工具解析 JSON5——尽早发现尾逗号等问题。
- 恢复彩排:在预发 Mac mini M4(或第二台 xxxMac)上应用 tarball,按当前文档执行
openclaw gateway restart,并打合成探测。 - 限时回滚:健康检查在 25 分钟 后仍失败则同时回滚 plist 与配置——禁止半回滚。
- 记录差异:更新内部 wiki 中的「最后良好」哈希与保险库密钥生成日期。
保持备份诚实的自动化挂钩
用 cron 或 CI 每 6 小时 对 openclaw.json 做哈希,若摘要变化却没有合并变更记录则自动开单。配合每周抓取 launchctl print,让 plist 漂移在下次 macOS 补丁前暴露。共享主机上让备份走专用自动化用户,避免人类桌面实验被打进生产包。若按 双 POP 配对矩阵 运行多区域,请将备份放在与区域无关的保险库,使任一节点都能重建另一台而无需纠结跨境拷贝。
恢复后首 60 分钟的运行指标
关注每分钟错误行数、webhook 接受率,以及 5 分钟 滑动平均 CPU。健康的 M4 网关在消息间隔期 CPU 通常低于 40 %(除非技能拉起浏览器)。若恢复后前 10 分钟 错误行超过 300,按入站指南暂停 webhook 入站,收集日志后再放量。若在新加坡、东京或美西多区域运行,从两个办公网络对同一合成调用比对墙钟,以识别区域特有的 TLS 中间盒——并非每次故障都来自 OpenClaw 本身。
常见问题:git、保险库与部分恢复
openclaw.json 应该放进 git 吗?
脱敏模板可以进 git;含频道白名单与令牌的生产文件不应入库。每晚导出净化副本,将密钥存入保险库并关联轮换工单。
恢复成功但 webhook 仍无动静怎么办?
对照 Webhook 加固指南 复查入站绑定与 TLS 终结,再按 分诊手册 运行 openclaw doctor,然后才放宽防火墙。
能否比从 tarball 恢复更快重建?
在 xxxMac 上经常可以:全新 Mac mini M4 通常约五分钟可达 SSH。将脱敏「黄金」配置放在 git 并重放自动化;当工作区文案或技能布局才是资产时再走 tarball 恢复。
可靠的智能体需要可靠的磁盘与网络。Apple Silicon M4 在 xxxMac 上为解析—重启循环提供余量,避免老旧 Intel 上常见的热节流;专属 1 Gbps 让机外备份目标适合每日配置推送。新加坡、东京与美西的多区域布局让你能在真正执行切换的团队附近演练灾备。约五分钟开通意味着下次演练可以是全新节点,而非带病克隆——排期演练时使用 控制台,并在每张工单附上 帮助中心 链接。预算允许热备时,在下次故障倒逼采购前先在 定价 上对比方案。
在生产需要之前先演练恢复
阅读帮助中心运行手册,对比 Mac mini M4 方案,并为下次备份演练开通预发主机。