virtual-insanity
← 리포트 목록

Codex CLI 적극 활용 방안

2026-04-03 claude [codex, 시스템설계, 분업, 도구통합]

Codex CLI v0.117.0 적극 활용 방안

현재 상태 요약

  • 인증: ChatGPT Plus OAuth (api.openai.com 아닌 chatgpt.com 경유)
  • 모델: gpt-5.4 (기본), gpt-5.4-mini (경량)
  • MCP 서버 4개: codex-self, workspace-fs, knowledge-memory, agent-bus
  • 세션 이력: 3/28 하루 51세션 (활발), 최근은 일 1~3세션 (소극)

1. 기능별 테스트 결과

기능 동작 Codex만의 장점 제한사항
exec O (MCP 로딩 시간 주의) 비대화형 자율 실행, --output-schema로 구조화 출력, --json JSONL 스트림 MCP 4개 startup_timeout=90초씩 → 초기 지연. --ephemeral -c 'mcp_servers={}'로 우회 가능
review O (완전 작동) P1/P2/P3 자동 분류, diff 밖 관련 파일까지 추적, 운영 시나리오 서술 --uncommitted[PROMPT] 동시 사용 불가 (v0.117 버그). 2~3분 소요
mcp-server O (완전 작동) Claude Code에서 MCP 도구로 직접 호출, 멀티턴(codex-reply), approval/sandbox 인자 제어 config.toml에 이미 설정됨. 즉시 활용 가능
sandbox O (macOS Seatbelt) 네트워크 완전 차단, 쓰기 차단, --log-denials 감사 로그 codex exec 내부 샌드박스와 별개 CLI
cloud O (GitHub 레포 필수) 비동기 클라우드 실행 → 로컬에서 다른 작업 가능, apply로 diff 적용 GitHub 연동 레포만, 2분+ 대기, 볼트/파이프라인은 범위 밖

2. Claude Code와 분업 비교

항목 Claude Code (Opus 4.6) Codex (GPT-5.4)
비용 Anthropic API 크레딧 ChatGPT Plus 포함 (추가 비용 0)
속도 (응답) 즉시~수초 30초~3분 (MCP/API 지연)
코드 리뷰 자유형, 맥락 의존 구조화(P1/P2/P3), 관련 파일 자동 추적
코드 생성 대화형, 반복 수정 용이 일발 완성형, 비대화
샌드박스 없음 (호스트 직접 실행) Seatbelt 격리, 네트워크 차단
MCP 생태계 90+ 도구 연결 커스텀 MCP 4개
파일 접근 전체 파일시스템 workspace-write 범위 제한
멀티턴 대화 기본 exec는 일발, mcp-server는 멀티턴
클라우드 실행 없음 cloud exec → 비동기 처리
추론 모델 없음 o3/o4-mini 선택 가능

Codex만의 진짜 장점 (Claude Code로 대체 불가)

  1. 비용 0원 코드 생성 — ChatGPT Plus에 포함. API 크레딧 소모 없음
  2. Seatbelt 샌드박스 — 신뢰 못 하는 코드를 네트워크 차단 상태에서 안전 실행
  3. 구조화 코드 리뷰 — 라인 번호 + 우선순위 + 운영 시나리오 기반
  4. 비동기 클라우드 — cloud exec로 던져놓고 로컬에서 다른 작업
  5. output-schema — JSON Schema로 출력 형식 강제 → 파이프라인 연동에 적합
  6. 추론 모델(o3) — 복잡한 로직 검증에 reasoning 특화 모델 사용 가능

3. 워크플로우 통합 방안

A. 투자분석 워크플로우

단계 현재 Codex 통합 후
재무 계산 검증 cross_verify.py (미사용) 활성화: DCF/배수 계산을 Codex read-only로 교차 검증
어닝콜 요약 Claude only Codex exec + output-schema로 구조화 추출 → Claude가 분석
기업 비교표 수동 Codex exec로 데이터 정규화 → Claude가 판단
보고서 코드 Claude 생성 차트/시각화 코드는 Codex sandbox에서 테스트 후 적용

B. 파이프라인 워크플로우

단계 현재 Codex 통합 후
스크립트 수정 Claude Code 직접 Codex exec로 수정 → sandbox에서 안전 테스트 → 적용
코드 리뷰 없음 codex review --uncommitted 자동 실행 (크론)
에러 수리 에러 3회 시 구출 1회 시도 실패 즉시 Codex exec 병렬 투입
신규 파이프라인 Claude Code 전담 Codex cloud exec로 초안 → Claude Code가 통합

C. 크론/운영 워크플로우

단계 현재 Codex 통합 후
크론 실패 진단 error-resolve 스킬 Codex exec로 1차 진단 + 자동 수리 시도
일일 코드 리뷰 없음 새 크론: 매일 07:00 codex review --uncommitted → 텔레그램 보고
보안 감사 없음 새 크론: 주 1회 codex review "보안 취약점 집중"
스크립트 테스트 직접 실행 sandbox macos에서 격리 실행 후 결과 확인

4. 즉시 실행할 개선 5가지

(1) 일일 자동 코드 리뷰 크론 추가

매일 07:00 → codex review --uncommitted → 텔레그램 보고

(2) cross_verify.py 실제 연결

  • valuation 스크립트(dcf.py 등)에서 import해서 사용
  • 재무 계산 독립 검증 채널 확보

(3) exec 호출 최적화

  • -c 'mcp_servers={}'로 불필요한 MCP 로딩 제거 (경량 태스크)
  • --ephemeral로 세션 파일 미저장 (일회성 태스크)
  • 에러 1회 시 즉시 Codex 병렬 투입 (3회 대기 → 1회로)

(4) MCP 서버 경유 구조화 호출

  • 현재: shell subprocess로 호출
  • 개선: config.toml의 codex-self MCP로 호출 → approval/sandbox 제어, 멀티턴 가능

(5) output-schema 파이프라인 연동

  • 파이프라인 출력을 JSON Schema로 강제
  • 후처리 파싱 불필요, 바로 DB/볼트 저장 가능