Codex CLI v0.117.0 적극 활용 방안
현재 상태 요약
- 인증: ChatGPT Plus OAuth (api.openai.com 아닌 chatgpt.com 경유)
- 모델: gpt-5.4 (기본), gpt-5.4-mini (경량)
- MCP 서버 4개: codex-self, workspace-fs, knowledge-memory, agent-bus
- 세션 이력: 3/28 하루 51세션 (활발), 최근은 일 1~3세션 (소극)
1. 기능별 테스트 결과
| 기능 |
동작 |
Codex만의 장점 |
제한사항 |
| exec |
O (MCP 로딩 시간 주의) |
비대화형 자율 실행, --output-schema로 구조화 출력, --json JSONL 스트림 |
MCP 4개 startup_timeout=90초씩 → 초기 지연. --ephemeral -c 'mcp_servers={}'로 우회 가능 |
| review |
O (완전 작동) |
P1/P2/P3 자동 분류, diff 밖 관련 파일까지 추적, 운영 시나리오 서술 |
--uncommitted과 [PROMPT] 동시 사용 불가 (v0.117 버그). 2~3분 소요 |
| mcp-server |
O (완전 작동) |
Claude Code에서 MCP 도구로 직접 호출, 멀티턴(codex-reply), approval/sandbox 인자 제어 |
config.toml에 이미 설정됨. 즉시 활용 가능 |
| sandbox |
O (macOS Seatbelt) |
네트워크 완전 차단, 쓰기 차단, --log-denials 감사 로그 |
codex exec 내부 샌드박스와 별개 CLI |
| cloud |
O (GitHub 레포 필수) |
비동기 클라우드 실행 → 로컬에서 다른 작업 가능, apply로 diff 적용 |
GitHub 연동 레포만, 2분+ 대기, 볼트/파이프라인은 범위 밖 |
2. Claude Code와 분업 비교
| 항목 |
Claude Code (Opus 4.6) |
Codex (GPT-5.4) |
| 비용 |
Anthropic API 크레딧 |
ChatGPT Plus 포함 (추가 비용 0) |
| 속도 (응답) |
즉시~수초 |
30초~3분 (MCP/API 지연) |
| 코드 리뷰 |
자유형, 맥락 의존 |
구조화(P1/P2/P3), 관련 파일 자동 추적 |
| 코드 생성 |
대화형, 반복 수정 용이 |
일발 완성형, 비대화 |
| 샌드박스 |
없음 (호스트 직접 실행) |
Seatbelt 격리, 네트워크 차단 |
| MCP 생태계 |
90+ 도구 연결 |
커스텀 MCP 4개 |
| 파일 접근 |
전체 파일시스템 |
workspace-write 범위 제한 |
| 멀티턴 |
대화 기본 |
exec는 일발, mcp-server는 멀티턴 |
| 클라우드 실행 |
없음 |
cloud exec → 비동기 처리 |
| 추론 모델 |
없음 |
o3/o4-mini 선택 가능 |
Codex만의 진짜 장점 (Claude Code로 대체 불가)
- 비용 0원 코드 생성 — ChatGPT Plus에 포함. API 크레딧 소모 없음
- Seatbelt 샌드박스 — 신뢰 못 하는 코드를 네트워크 차단 상태에서 안전 실행
- 구조화 코드 리뷰 — 라인 번호 + 우선순위 + 운영 시나리오 기반
- 비동기 클라우드 — cloud exec로 던져놓고 로컬에서 다른 작업
- output-schema — JSON Schema로 출력 형식 강제 → 파이프라인 연동에 적합
- 추론 모델(o3) — 복잡한 로직 검증에 reasoning 특화 모델 사용 가능
3. 워크플로우 통합 방안
A. 투자분석 워크플로우
| 단계 |
현재 |
Codex 통합 후 |
| 재무 계산 검증 |
cross_verify.py (미사용) |
활성화: DCF/배수 계산을 Codex read-only로 교차 검증 |
| 어닝콜 요약 |
Claude only |
Codex exec + output-schema로 구조화 추출 → Claude가 분석 |
| 기업 비교표 |
수동 |
Codex exec로 데이터 정규화 → Claude가 판단 |
| 보고서 코드 |
Claude 생성 |
차트/시각화 코드는 Codex sandbox에서 테스트 후 적용 |
B. 파이프라인 워크플로우
| 단계 |
현재 |
Codex 통합 후 |
| 스크립트 수정 |
Claude Code 직접 |
Codex exec로 수정 → sandbox에서 안전 테스트 → 적용 |
| 코드 리뷰 |
없음 |
codex review --uncommitted 자동 실행 (크론) |
| 에러 수리 |
에러 3회 시 구출 |
1회 시도 실패 즉시 Codex exec 병렬 투입 |
| 신규 파이프라인 |
Claude Code 전담 |
Codex cloud exec로 초안 → Claude Code가 통합 |
C. 크론/운영 워크플로우
| 단계 |
현재 |
Codex 통합 후 |
| 크론 실패 진단 |
error-resolve 스킬 |
Codex exec로 1차 진단 + 자동 수리 시도 |
| 일일 코드 리뷰 |
없음 |
새 크론: 매일 07:00 codex review --uncommitted → 텔레그램 보고 |
| 보안 감사 |
없음 |
새 크론: 주 1회 codex review "보안 취약점 집중" |
| 스크립트 테스트 |
직접 실행 |
sandbox macos에서 격리 실행 후 결과 확인 |
4. 즉시 실행할 개선 5가지
(1) 일일 자동 코드 리뷰 크론 추가
매일 07:00 → codex review --uncommitted → 텔레그램 보고
(2) cross_verify.py 실제 연결
- valuation 스크립트(dcf.py 등)에서 import해서 사용
- 재무 계산 독립 검증 채널 확보
(3) exec 호출 최적화
-c 'mcp_servers={}'로 불필요한 MCP 로딩 제거 (경량 태스크)
--ephemeral로 세션 파일 미저장 (일회성 태스크)
- 에러 1회 시 즉시 Codex 병렬 투입 (3회 대기 → 1회로)
(4) MCP 서버 경유 구조화 호출
- 현재: shell subprocess로 호출
- 개선: config.toml의 codex-self MCP로 호출 → approval/sandbox 제어, 멀티턴 가능
(5) output-schema 파이프라인 연동
- 파이프라인 출력을 JSON Schema로 강제
- 후처리 파싱 불필요, 바로 DB/볼트 저장 가능