virtual-insanity
← 뒤로

700 실험실/260403-하네스엔지니어링-방법론-v2.md

2026-04-06 21:55


tags: [하네스, 에이전트, 방법론, 시스템] created: 2026-04-03 source: OpenAI, Anthropic, Martin Fowler, LangChain, HumanLayer, 지식사랑방 LLM토픽


하네스 엔지니어링 방법론 v2

Agent = Model + Harness. 모델을 바꾸기 전에 환경을 바꿔라.

핵심 공식

  • 프롬프트 엔지니어링: "뭘 물어볼까?" → 지시문 텍스트 설계
  • 컨텍스트 엔지니어링: "뭘 보여줄까?" → 모델이 보는 모든 토큰 설계
  • 하네스 엔지니어링: "환경을 어떻게 설계할까?" → 모델 바깥의 제약과 시스템 전체

하네스 6대 구성요소

  1. 컨텍스트 파일 (CLAUDE.md/AGENTS.md) — 60줄 이내 권장, 자동 생성은 토큰 낭비
  2. 도구/MCP 서버 — 선택적 연결, 도구 너무 많으면 멍청해짐
  3. 스킬 — 점진적 공개, 필요할 때만 활성화
  4. 서브에이전트 — 컨텍스트 방화벽, 중간 잡음 격리
  5. — 생애주기 제어, 성공 시 조용/실패 시만 표면화
  6. 가드레일 + 피드백 루프 — 실수할 때마다 "이런 실수 하지 마라" 추가

Martin Fowler 이중 제어 프레임워크

Guide (피드포워드) — 행동 전 방향 잡기

  • 계산적: 린터, 타입체커, LSP (밀리초, 결정론적)
  • 추론적: AI 리뷰 스킬 (분 단위, 의미론적)

Sensor (피드백) — 행동 후 교정

  • 정적 분석, 테스트 스위트, 커버리지
  • 드리프트 감지 (죽은 코드, 의존성)

"피드백만으로는 같은 실수를 반복하고, 피드포워드만으로는 효과를 검증할 수 없다."

안티패턴 vs 올바른 접근

안티패턴: 모든 작업에 같은 스킬 찍어내기

brainstorming → plan → parallel → verification 고정 파이프라인은 틀림.

올바른 접근: 작업 복잡도별 다른 경로

복잡도 경로 예시
낮음 (3단계 이하) 바로 실행 → 결과 보고 파일 수정, 설정 변경
중간 (4~7단계) 서브에이전트 병렬 → 검증 크론 수정, MCP 연결
높음 (8단계+) 설계 → 계획 → 병렬 → 검증 아키텍처 전환
되돌릴 수 없음 설계 + 검증 2회 배포, 데이터 삭제

경쟁 프레이밍 (Gaslight 기법)

프레이밍 효과 적용
경쟁 프레임 전략적 사고 유발 "다른 팀이 더 나은 방안을 냈는데..."
회의적 프레임 리스크 발견 향상 verification에 "놓친 약점 찾아라"
전문가 귀속 정교한 분석 "20년 경력 애널리스트로서"
버전 시퀀싱 혁신 유도 "이건 1.0이었고 이제 2.0"

OpenClaw 적용 원칙 6가지

  1. 실패 교훈 자동 축적 — 실수 → harness-lessons.md 자동 기록 → CLAUDE.md 반영
  2. 컨텍스트 위생 — 자주 쓰는 10개 스킬만 기본 로딩, 나머지 deferred
  3. 서브에이전트 모델 배분 — 리스크 수준에 따라 검증 깊이 자동 조절
  4. 장기 실행 패턴 — progress 파일 + 피처 리스트 → 한 피처씩 진행
  5. 경쟁 프레이밍 내장 — verification에 회의적 프레임, research에 전문가 귀속
  6. Hashline 교훈 — 환경만 바꿔도 6.7%→68.3%. 모델 전에 하네스부터.

이미 보유한 하네스 자산

  • .claude/agents/ 에이전트 7개
  • everything-claude-code agent-harness-construction 스킬
  • 볼트 노트: 700 실험실/2026-03-30-GeekNewsHada-Harness-에이전트팀-메타스킬.md
  • cmux 멀티세션 + 하네스 감시기

출처