OpenClaw를 「그냥 또 다른 Node 앱」으로 다루면, 게이트웨이 상태가 디스크의 JSON5, LaunchAgent plist, 워크스페이스 트리, 스크린샷에 절대 올리면 안 되는 비밀에 걸쳐 있음을 아프게 배웁니다. 이 2026 플레이북은 xxxMac Mac mini M4의 SRE·솔로 빌더에게 재현 가능한 백업 범위, 체크섬 습관, 복원 순서, 잘못된 편집 후 롤백 가드레일을 제공합니다. 아티팩트 인벤토리 표, 아홉 단계, 로그·디스크 수치 임계값, doctor·로그 분류 플레이북 및 게이트웨이 업그레이드·롤백 가이드에 맞춘 FAQ를 담습니다. 업로드 자동화 전에 비밀 관리를 읽으세요.
복구 불가능한 드리프트 직전 신호
- 같은 오후 서로 다른 SSH 세션에서 두 엔지니어가
openclaw.json을 편집하고, 실행 중 게이트웨이가 어느 버전을 파싱했는지 아무도 모름. - LaunchAgent 라벨
ai.openclaw.gateway(또는 문서화된 동등명)은 깨끗이 재시작되지만 워크스페이스 경로가 바뀌어 채널이 오프라인. - webhook 재시도를 쫓는 동안 디버그 로그가 폭발해 36시간 안에 디스크 알림 —
chmod 777전에 인그레스 하드닝과 상관시키세요. - 헤드리스
ssh편집이 JSON5 쉼표를 망가뜨렸는데 Web VNC를 아무도 예약하지 않아 GUI 수정이 멈춤.
백업 아티팩트 인벤토리
| 아티팩트 | 전형적 경로 | 포함? | 비고 |
|---|---|---|---|
| 게이트웨이 설정 | ~/.openclaw/openclaw.json |
예(마스킹) | JSON5는 주석 허용 — 파서 충실도를 위해 그대로 보존 |
| LaunchAgent plist | ~/Library/LaunchAgents/ |
예 | 티켓에 launchctl print 출력 첨부 |
| 워크스페이스 페르소나 | 워크스페이스 IDENTITY.md 등 |
예 | 게이트웨이가 참조하지 않는 로컬 실험 제외 |
| 원시 환경보내기 | 셸 기록 | 아니오 | 볼트에서 재구성; 기록 백업은 유해 |
복원 리스크 매트릭스(증상 → 첫 조치)
| 증상 | 첫 조치 | 에스컬레이션 조건 |
|---|---|---|
| plist 로드 직후 게이트웨이 종료 | 상류 린터로 JSON5 검증; 마지막 정상 tarball로 복원 | 15분 안에 연속 두 번 복원 실패 |
| 채널은 연결되나 도구가 멈춤 | 워크스페이스 마운트·여유 디스크 >12 % | 통합 메모리 압박이 20분 넘게 빨강 |
| 복원 후 webhook 401 | 볼트 리비전과 서명 비밀 대조 | 비밀은 로테됐는데 게이트웨이가 오래된 HMAC 제공 |
아홉 단계 백업·복원 훈련(분기 최소 1회)
- 변경 동결: 채팅에 20분 변경 동결 공지; 훈련 중 ClawHub 가이드에서 스킬 설치 중단.
- 버전 기록:
openclaw --version(또는 문서화된 CLI), Node 메이저, macOS 빌드 기록. - 설정 복사:
openclaw.json을 날짜 폴더에 복제하고 티켓에sha256sum기록. - plist보내기:LaunchAgent plist와 게이트웨이 라벨에 대한
launchctl listgrep 보관. - 워크스페이스 부분 tar:Markdown 페르소나·도구 설정 포함; lockfile로 재현 가능하면
node_modules제외. - 오프라인 검증:노트북에서 게이트웨이와 같은 메이저 도구로 JSON5 파싱 — 후행 쉼표를 일찍 잡기.
- 복원 리허설:스테이징 Mac mini M4(또는 두 번째 xxxMac)에 tarball 적용, 현재 문서대로
openclaw gateway restart, 합성 ping. - 타임박스 롤백:헬스 체크가 25분 후에도 실패하면 plist와 설정을 함께 되돌림 — 반만 되돌리지 않음.
- 델타 문서화:내부 위키에 「마지막 정상」 해시와 볼트 비밀 생성일 업데이트.
백업을 정직하게 유지하는 자동화 훅
cron 또는 CI로 openclaw.json을 6시간마다 해시하고, 병합된 변경 기록 없이 다이제스트가 바뀌면 티켓을 엽니다. 주간 launchctl print 캡처와 짝지어 다음 macOS 패치 전에 plist 드리프트를 드러내세요. 공유 호스트에서는 전용 자동화 사용자로 백업 아티팩트를 라우팅해 인간 데스크톱 실험이 프로덕션 번들에 섞이지 않게 하세요. 듀얼 POP 매트릭스로 페어를 운영하면 백업은 리전에 무관한 볼트에 두어 어느 노드든 국경 걱정 없이 상대를 재구축할 수 있게 하세요.
복원 직후 60분 운영 지표
분당 오류 줄 수, webhook 수락률, 5분 창의 평활 CPU를 봅니다. 건강한 M4 게이트웨이는 메시지 사이에 보통 40 % 미만(스킬이 브라우저를 띄우지 않는 한). 복원 후 첫 10분에 오류 줄이 300을 넘으면 인그레스 가이드 패턴으로 webhook 인바운드를 멈추고 로그를 모은 뒤 다시 엽니다. 싱가포르, 도쿄, 미국 서부에 걸쳐 운영하면 두 사무실 네트워크에서 같은 합성 호출의 벽시계를 비교해 리전별 TLS 미들박스를 잡으세요 — 모든 실패가 OpenClaw 자체는 아닙니다.
FAQ: git, 볼트, 부분 복원
openclaw.json을 git에 둬야 하나요?
마스킹한 템플릿은 git에 둘 수 있습니다. 채널 허용 목록과 토큰이 있는 프로덕션 파일은 두지 마세요. 매일 밤 정제 사본을보내고 비밀은 볼트에 로테이션 티켓과 함께 보관하세요.
복원은 됐는데 webhook이 조용하면?
Webhook 하드닝 가이드에 따라 인그레스 바인딩과 TLS 종료를 다시 확인하고, 분류 플레이북대로 openclaw doctor를 실행한 뒤 방화벽을 넓히세요.
tarball보다 빠르게 재구축할 수 있나요?
xxxMac에서는 자주 그렇습니다: 새 Mac mini M4는 보통 약 5분이면 SSH 준비. git에 「골든」 마스킹 설정을 두고 자동화를 재생; 워크스페이스 문구나 스킬 배치가 자산일 때만 tarball 복원.
신뢰할 수 있는 에이전트에는 신뢰할 수 있는 디스크와 네트워크가 필요합니다. Apple Silicon M4는 xxxMac에서 파싱—재시작 사이클에 여유를 주고 구형 Intel에서 흔한 열 스로틀을 피하기 쉽습니다. 전용 1 Gbps는 오프호스트 백업 대상으로 매일 설정 푸시를 현실적으로 만듭니다. 싱가포르, 도쿄, 미국 서부 다리전은 실제 컷오버를 수행할 팀 근처에서 DR를 리허설할 수 있게 합니다. 약 5분 프로비저닝이면 다음 리허설은 아픈 클론이 아니라 새 노드일 수 있습니다 — 훈련 일정은 콘솔, 각 티켓에 고객센터 링크를 붙이세요. 웜 스탠바이 예산이 있으면 다음 장애가 긴급 주문을 강요하기 전에 요금에서 플랜을 비교하세요.
프로덕션이 필요하기 전에 복구를 리허설하세요
고객센터 런북을 읽고 Mac mini M4 플랜을 비교한 뒤 다음 백업 훈련용 스테이징 호스트를 프로비저닝하세요.