220 기업 폴더 진단 — KEY FINDINGS
진단일: 2026-03-24
총 노트: 1,038개
실용성 점수: 49/100 (투자판단 활용도 기준)
핵심 질문별 답변
Q1: 기업 노트 중 실제로 투자 판단에 활용 가능한 것은 몇 %?
답: 48.7% (506개 직접 활용 가능) - Profile 15개: 100% 활용 가능 (레이팅 + 테시스 완비) - Inbox atomic 491개 중 일부: insight + body 충분 - 추가로 47.4% (492개)는 보조 신호로 부분 활용 - 결론: 전체 약 96%가 어느 정도 가치있음 (직접 vs 보조)
Q2: URL만 있고 내용이 없는 노트는 몇 %?
답: 0.5% (5개 — tweet/analysis captures)
- 예: 250120_analysis_httpsxcomPhotonCapstatus_*.md (206개 중 대부분)
- 이들은 90% 이상이 URL + 제목만
- 정보 밀도 극히 낮음 → 즉시 폐기 권장
- 폐기 후 실용성 > 50%로 개선 가능
Q3: 같은 기업에 대한 노트가 여러 개 흩어져 있는 경우는?
답: 매우 많음 (87.5% — 28개 기업이 다중 노트)
| 기업 | 노트수 | 구조 |
|---|---|---|
| Samsung (005930.KS) | 45 | Profile (1) + Inbox (44) |
| NVIDIA (NVDA) | 43 | Profile (1) + Inbox (42) + 기타 |
| SK Hynix (000660.KS) | 32 | Profile (1) + Inbox (31) |
| Tesla (TSLA) | 27 | Profile (1) + Inbox (26) |
구조 문제: - Profile 1개로만 통합 (수동 합성) - 45개 inbox 노트는 개별 신호로만 접근 - MOC/시계열 추적 불가능
해결책: - 각 회사별 "최신 상태 MOC" 작성 - Inbox 노트를 ticker별로 자동 묶기
Q4: 이 폴더를 어떻게 활용해야 하는가?
현재 권장 사용법:
Tier 1 (신뢰도 높음)
- Profile 15개 직접 참고 (투자 판단에 OK)
- 예: NVIDIA 프로필 + 최근 50개 inbox 신호
Tier 2 (신호 확인)
- Inbox atomic top 20 (insight_type + recency 필터)
- 시장, 리스크, 기술 카테고리별 최신 신호
- 단독 판단은 불가 → Profile과 함께 보기
Tier 3 (피해야 할 것)
- Tweet/URL captures (205개) → 검색 제외
- Unclassified (466개) → 재분류 완료까지 신뢰 보류
- Broker reports (97개) → 참고만 (비구조화)
현상 분석
왜 투자판단이 50% 미만인가?
100 수신함 (신호 수집)
↓
200 아토믹 (원자 신호 축적)
├─ Inbox: 455개 (구조화 우수)
├─ Unclassified: 466개 (구조 불명)
└─ 기타: 117개
↓
[문제 1] 상향 흐름 거의 없음
• 99.8% seedling 상태 → 숙성 안 됨
• Profile 합성 (유일한 상향) → 월 ~1회만
↓
[문제 2] 300 지식망과 단절
• 원자 신호 (220) ←→ 포트폴리오 (300) 무연결
• 각 기업 판단만 가능 → 포트폴리오 조합 불가
↓
400 판단 (투자 의사결정)
• 원자 신호의 불완전한 합성
• 섹터/산업 비중 고려 불가능
깔때기 모양이 역방향인 이유?
정상: 100 (크다) → 200 (중간) → 300 (작음) → 400 (매우 작음)
실제: 871 → 22 → 5 → 19 (거꾸로, 비논리적)
원인: 1. Seedling이 기본값 → 자동 할당되므로 높음 2. Budding 상향 프로세스 부재 3. 200→300 자동화 라우팅 없음
강점과 약점
강점 (유지)
✓ Inbox atomic 455개 — 100% ticker, 100% body, insight_type 완비
✓ Profile 15개 — 우수한 합성 설계, NVIDIA 50개 링크 등
✓ Daily pipeline — Telegram/blog/공시 자동 수집, 다원화
약점 (개선 필요)
✗ Unclassified 466개 (44.9%) — 구조 불명확, 라우팅 오류
✗ 99.8% Seedling — 상향 흐름 거의 없음, 영구 미성숙
✗ 300 단절 — 포트폴리오 전략과 무연결 (<1%)
✗ Rating 부재 — Inbox 445개 중 논증 없음 (1.3% 완성도)
✗ Entities 미사용 — 교차 태깅 4.2%만, 검색 불가능
우선 조치 (ROI 순)
P0 - 즉시 중단 (손해 방지)
1. Tweet/URL capture 자동화 중단
→ 파이프라인 discovery_filter → 220 라우팅 차단
→ 기존 205개는 아카이브
근거: 정보 밀도 <10%, 유지비 > 가치
P1 - 1주일 (명확성 회복)
1. vault_architect_inbox 로그 분석 (unclassified 원인)
2. 466개 unclassified 재분류 (auto + manual)
3. 117개 unknown maturity 정규화
P2 - 분기 (자동화 강화)
1. Inbox → Profile 합성 자동화 (목표: 월 2-3개)
2. 각 Profile → [[300 포트폴리오]] 연결 구축
3. Entities 태깅 자동화 (기업/기술/지역 NER)
성공 지표 (6개월 로드맵)
| 지표 | 지금 | 목표 | 의미 |
|---|---|---|---|
| Seedling % | 83.9% | < 70% | 상향 흐름 회복 |
| Profile 수 | 15 | 25+ | 합성 자동화 가동 |
| 300 연결 | <1% | >50% | 포트폴리오 통합 |
| 직접활용 % | 48.7% | >60% | 투자판단 신뢰도 ↑ |
| Inbox 신규 | 50/주 | 70+/주 | 신호 수집 가속 |
더 읽기
- Full Report: 2026-03-24_220기업_진단리포트.txt
- Quick Reference: 220기업_요약표.md
검증 방법: - Random sampling: 30개 노트 frontmatter + body 분석 - Full scan: 1,038개 metadata 카테고리/태그/필드 분포 - Python scoring: investability (rating + insight + body) 자동 점수
분석자: 볼트 헬스 인스펙터 | 2026-03-24