virtual-insanity
← 리포트 목록

jobs_ha_uncage

2026-04-24 5

260424 — 5개 active job HA uncage 검증

  • 실행 시각: 2026-04-24 14:22~14:28 KST
  • 대상: hmig-cold-alert, hmig-rain-alert, hmig-late-lights, hmig-kpi-daily, hmig-kpi-weekly
  • 결론: HA production endpoint 연결 실패 → HA 잡 3개는 active 유지하되 격리 유지. KPI 2개는 정상 scheduled 유지. 모니터 2개 등록 완료.

1) 현재 job 상태

job enabled/state schedule HA/발송 상태
hmig-cold-alert true / scheduled 10 7 * * * HA 격리 유지: HA_URL=http://127.0.0.1:9, HA_TIMEOUT=1
hmig-rain-alert true / scheduled 15 7 * * * HA 격리 유지: HA_URL=http://127.0.0.1:9, HA_TIMEOUT=1
hmig-late-lights true / scheduled 0 23 * * * HA 격리 유지: HA_URL=http://127.0.0.1:9, HA_TIMEOUT=1
hmig-kpi-daily true / scheduled 45 7 * * * HA 무관, 정기 발송 job 유지
hmig-kpi-weekly true / scheduled 50 7 * * 1 HA 무관, 정기 발송 job 유지

Hermes jobs 총수: 82

백업: - /Users/ron/.hermes/cron/jobs.json.bak-hmig-monitor-20260424_142658 - /Users/ron/.hermes/cron/jobs.json.bak-ha-recage-20260424_142729

2) HA production endpoint 읽기 전용 검증

대상 URL: - https://srv1321629.hstgr.cloud

토큰: - /Users/ron/.hermes/secrets/ha_token 존재, 권한 600, 값은 보고서에 미노출

검증 결과:

curl /api/ timeout 8:
curl: (6) Could not resolve host: srv1321629.hstgr.cloud
HTTP_CODE=000
dig srv1321629.hstgr.cloud:
status: NXDOMAIN
AUTHORITY: hstgr.cloud SOA any1.hostinger.com
curl --resolve srv1321629.hstgr.cloud:443:72.62.255.251 /api/ timeout 12:
HTTP_CODE=000 TIME_TOTAL=12.007738

nc 72.62.255.251:443:
Operation timed out

로컬 후보 재확인:

http://127.0.0.1:8123/api/        connect refused
http://homeassistant.local:8123/api/ resolving timeout
http://192.168.0.1:8123/api/      timeout
http://192.168.0.8:8123/api/      connect refused
http://192.168.0.53:8123/api/     connect refused

원문 로그: - /tmp/ha_prod_readonly_20260424_142258.log - /tmp/ha_prod_resolve_20260424_142307.log - /tmp/ha_local_candidates_20260424_142359.log

판정: production HA endpoint 미확정/비가용. uncage 중단.

3) 왜 격리 유지했는가

late-lights는 조건 충족 시 실제로 다음 액션을 수행한다.

  • TTS 발화
  • 조명 switch turn_off
  • 온수매트 켜기
  • 커튼 닫기

따라서 HA API가 읽기 전용 /api/에서 정상 확인되기 전까지 production URL로 scheduled 실행시키면, DNS가 갑자기 복구되는 순간 미검증 홈 자동화가 실행될 수 있다. 그래서 세 센서 job은 active/scheduled 상태는 유지하되 HA URL을 폐쇄 포트로 격리했다.

4) 다음 정기 발화 시각

현재 기준: 2026-04-24 14:27 KST

job 다음 발화
hmig-late-lights 2026-04-24 23:00 KST
hmig-cold-alert 2026-04-25 07:10 KST
hmig-rain-alert 2026-04-25 07:15 KST
hmig-kpi-daily 2026-04-25 07:45 KST
hmig-kpi-weekly 2026-04-27 07:50 KST

5) 모니터 등록

신규 모니터 스크립트: - /Users/ron/.hermes/workspace/scripts/admin/monitor_hmig_5_jobs.py

등록된 Hermes monitor jobs:

monitor job schedule 역할
hmig-5-jobs-monitor-morning 55 7 * * * cold/rain/kpi-daily 발화 후 cron output 확인
hmig-5-jobs-monitor-night 10 23 * * * late-lights 발화 후 cron output 확인

모니터 산출물: - /Users/ron/knowledge-agent/400-reports/YYYYMMDD_hmig_5_jobs_monitor.md - 현재 수동 실행 산출물: /Users/ron/knowledge-agent/400-reports/20260424_hmig_5_jobs_monitor.md

현재 모니터 원문:

HA API: FAIL — curl: (6) Could not resolve host: srv1321629.hstgr.cloud

hmig-cold-alert     WAIT
hmig-rain-alert     WAIT
hmig-kpi-daily      WAIT
hmig-late-lights    WAIT
hmig-kpi-weekly     WAIT

6) OpenClaw 백업 plist archive 조건

아직 archive하지 않았다.

조건: 1. HA production endpoint가 /api/ 또는 /api/states에서 HTTP 200 확인 2. 격리 URL 제거 후 scheduled 1회 정상 실행 3. monitor 보고서에서 해당 job SEEN, exit 0 확인

그 뒤에만 기존 OpenClaw 백업 plist를 archive로 이동 권고.

7) 해리 결정 필요

HA live 복구를 위해 아래 중 하나가 필요하다.

  1. srv1321629.hstgr.cloud DNS/서버 복구
  2. 실제 HA local IP 또는 Nabu Casa URL 제공/발굴
  3. HA 센서 3개를 계속 격리 상태로 두고 KPI만 운영

현재는 3번 상태로 안전 유지.

8) 자체평가

  • 정확성: 4.4/5 — HA endpoint를 DNS/API/IP/로컬 후보로 실측했고, 실패 조건에 따라 격리 유지.
  • 완성도: 4.2/5 — live uncage는 HA 장애로 미완료이나, monitor와 안전 상태까지 구성.
  • 검증: 4.5/5 — curl/dig/nc/local 후보, jobs.json, py_compile, monitor 수동 실행 확인.
  • 최소 변경: 4.4/5 — 센서 job 3개 HA_URL만 안전 격리, monitor 2개 추가. 삭제 없음.

종합: 4.4/5

DONE