260424 — 5개 active job HA uncage 검증
- 실행 시각: 2026-04-24 14:22~14:28 KST
- 대상:
hmig-cold-alert,hmig-rain-alert,hmig-late-lights,hmig-kpi-daily,hmig-kpi-weekly - 결론: HA production endpoint 연결 실패 → HA 잡 3개는 active 유지하되 격리 유지. KPI 2개는 정상 scheduled 유지. 모니터 2개 등록 완료.
1) 현재 job 상태
| job | enabled/state | schedule | HA/발송 상태 |
|---|---|---|---|
| hmig-cold-alert | true / scheduled | 10 7 * * * |
HA 격리 유지: HA_URL=http://127.0.0.1:9, HA_TIMEOUT=1 |
| hmig-rain-alert | true / scheduled | 15 7 * * * |
HA 격리 유지: HA_URL=http://127.0.0.1:9, HA_TIMEOUT=1 |
| hmig-late-lights | true / scheduled | 0 23 * * * |
HA 격리 유지: HA_URL=http://127.0.0.1:9, HA_TIMEOUT=1 |
| hmig-kpi-daily | true / scheduled | 45 7 * * * |
HA 무관, 정기 발송 job 유지 |
| hmig-kpi-weekly | true / scheduled | 50 7 * * 1 |
HA 무관, 정기 발송 job 유지 |
Hermes jobs 총수: 82
백업:
- /Users/ron/.hermes/cron/jobs.json.bak-hmig-monitor-20260424_142658
- /Users/ron/.hermes/cron/jobs.json.bak-ha-recage-20260424_142729
2) HA production endpoint 읽기 전용 검증
대상 URL:
- https://srv1321629.hstgr.cloud
토큰:
- /Users/ron/.hermes/secrets/ha_token 존재, 권한 600, 값은 보고서에 미노출
검증 결과:
curl /api/ timeout 8:
curl: (6) Could not resolve host: srv1321629.hstgr.cloud
HTTP_CODE=000
dig srv1321629.hstgr.cloud:
status: NXDOMAIN
AUTHORITY: hstgr.cloud SOA any1.hostinger.com
curl --resolve srv1321629.hstgr.cloud:443:72.62.255.251 /api/ timeout 12:
HTTP_CODE=000 TIME_TOTAL=12.007738
nc 72.62.255.251:443:
Operation timed out
로컬 후보 재확인:
http://127.0.0.1:8123/api/ connect refused
http://homeassistant.local:8123/api/ resolving timeout
http://192.168.0.1:8123/api/ timeout
http://192.168.0.8:8123/api/ connect refused
http://192.168.0.53:8123/api/ connect refused
원문 로그:
- /tmp/ha_prod_readonly_20260424_142258.log
- /tmp/ha_prod_resolve_20260424_142307.log
- /tmp/ha_local_candidates_20260424_142359.log
판정: production HA endpoint 미확정/비가용. uncage 중단.
3) 왜 격리 유지했는가
late-lights는 조건 충족 시 실제로 다음 액션을 수행한다.
- TTS 발화
- 조명 switch turn_off
- 온수매트 켜기
- 커튼 닫기
따라서 HA API가 읽기 전용 /api/에서 정상 확인되기 전까지 production URL로 scheduled 실행시키면, DNS가 갑자기 복구되는 순간 미검증 홈 자동화가 실행될 수 있다. 그래서 세 센서 job은 active/scheduled 상태는 유지하되 HA URL을 폐쇄 포트로 격리했다.
4) 다음 정기 발화 시각
현재 기준: 2026-04-24 14:27 KST
| job | 다음 발화 |
|---|---|
| hmig-late-lights | 2026-04-24 23:00 KST |
| hmig-cold-alert | 2026-04-25 07:10 KST |
| hmig-rain-alert | 2026-04-25 07:15 KST |
| hmig-kpi-daily | 2026-04-25 07:45 KST |
| hmig-kpi-weekly | 2026-04-27 07:50 KST |
5) 모니터 등록
신규 모니터 스크립트:
- /Users/ron/.hermes/workspace/scripts/admin/monitor_hmig_5_jobs.py
등록된 Hermes monitor jobs:
| monitor job | schedule | 역할 |
|---|---|---|
hmig-5-jobs-monitor-morning |
55 7 * * * |
cold/rain/kpi-daily 발화 후 cron output 확인 |
hmig-5-jobs-monitor-night |
10 23 * * * |
late-lights 발화 후 cron output 확인 |
모니터 산출물:
- /Users/ron/knowledge-agent/400-reports/YYYYMMDD_hmig_5_jobs_monitor.md
- 현재 수동 실행 산출물: /Users/ron/knowledge-agent/400-reports/20260424_hmig_5_jobs_monitor.md
현재 모니터 원문:
HA API: FAIL — curl: (6) Could not resolve host: srv1321629.hstgr.cloud
hmig-cold-alert WAIT
hmig-rain-alert WAIT
hmig-kpi-daily WAIT
hmig-late-lights WAIT
hmig-kpi-weekly WAIT
6) OpenClaw 백업 plist archive 조건
아직 archive하지 않았다.
조건:
1. HA production endpoint가 /api/ 또는 /api/states에서 HTTP 200 확인
2. 격리 URL 제거 후 scheduled 1회 정상 실행
3. monitor 보고서에서 해당 job SEEN, exit 0 확인
그 뒤에만 기존 OpenClaw 백업 plist를 archive로 이동 권고.
7) 해리 결정 필요
HA live 복구를 위해 아래 중 하나가 필요하다.
srv1321629.hstgr.cloudDNS/서버 복구- 실제 HA local IP 또는 Nabu Casa URL 제공/발굴
- HA 센서 3개를 계속 격리 상태로 두고 KPI만 운영
현재는 3번 상태로 안전 유지.
8) 자체평가
- 정확성: 4.4/5 — HA endpoint를 DNS/API/IP/로컬 후보로 실측했고, 실패 조건에 따라 격리 유지.
- 완성도: 4.2/5 — live uncage는 HA 장애로 미완료이나, monitor와 안전 상태까지 구성.
- 검증: 4.5/5 — curl/dig/nc/local 후보, jobs.json, py_compile, monitor 수동 실행 확인.
- 최소 변경: 4.4/5 — 센서 job 3개 HA_URL만 안전 격리, monitor 2개 추가. 삭제 없음.
종합: 4.4/5
DONE