virtual-insanity
← 뒤로

800 운영/850 실행/220기업_진단_FINDINGS.md

220 기업 폴더 진단 — KEY FINDINGS

진단일: 2026-03-24
총 노트: 1,038개
실용성 점수: 49/100 (투자판단 활용도 기준)


핵심 질문별 답변

Q1: 기업 노트 중 실제로 투자 판단에 활용 가능한 것은 몇 %?

: 48.7% (506개 직접 활용 가능) - Profile 15개: 100% 활용 가능 (레이팅 + 테시스 완비) - Inbox atomic 491개 중 일부: insight + body 충분 - 추가로 47.4% (492개)는 보조 신호로 부분 활용 - 결론: 전체 약 96%가 어느 정도 가치있음 (직접 vs 보조)


Q2: URL만 있고 내용이 없는 노트는 몇 %?

: 0.5% (5개 — tweet/analysis captures) - 예: 250120_analysis_httpsxcomPhotonCapstatus_*.md (206개 중 대부분) - 이들은 90% 이상이 URL + 제목만 - 정보 밀도 극히 낮음 → 즉시 폐기 권장 - 폐기 후 실용성 > 50%로 개선 가능


Q3: 같은 기업에 대한 노트가 여러 개 흩어져 있는 경우는?

: 매우 많음 (87.5% — 28개 기업이 다중 노트)

기업 노트수 구조
Samsung (005930.KS) 45 Profile (1) + Inbox (44)
NVIDIA (NVDA) 43 Profile (1) + Inbox (42) + 기타
SK Hynix (000660.KS) 32 Profile (1) + Inbox (31)
Tesla (TSLA) 27 Profile (1) + Inbox (26)

구조 문제: - Profile 1개로만 통합 (수동 합성) - 45개 inbox 노트는 개별 신호로만 접근 - MOC/시계열 추적 불가능

해결책: - 각 회사별 "최신 상태 MOC" 작성 - Inbox 노트를 ticker별로 자동 묶기


Q4: 이 폴더를 어떻게 활용해야 하는가?

현재 권장 사용법:

Tier 1 (신뢰도 높음)

  • Profile 15개 직접 참고 (투자 판단에 OK)
  • 예: NVIDIA 프로필 + 최근 50개 inbox 신호

Tier 2 (신호 확인)

  • Inbox atomic top 20 (insight_type + recency 필터)
  • 시장, 리스크, 기술 카테고리별 최신 신호
  • 단독 판단은 불가 → Profile과 함께 보기

Tier 3 (피해야 할 것)

  • Tweet/URL captures (205개) → 검색 제외
  • Unclassified (466개) → 재분류 완료까지 신뢰 보류
  • Broker reports (97개) → 참고만 (비구조화)

현상 분석

왜 투자판단이 50% 미만인가?

100 수신함 (신호 수집)
    ↓
200 아토믹 (원자 신호 축적)
    ├─ Inbox: 455개 (구조화 우수)
    ├─ Unclassified: 466개 (구조 불명)
    └─ 기타: 117개
    ↓
[문제 1] 상향 흐름 거의 없음
    • 99.8% seedling 상태 → 숙성 안 됨
    • Profile 합성 (유일한 상향) → 월 ~1회만
    ↓
[문제 2] 300 지식망과 단절
    • 원자 신호 (220) ←→ 포트폴리오 (300) 무연결
    • 각 기업 판단만 가능 → 포트폴리오 조합 불가
    ↓
400 판단 (투자 의사결정)
    • 원자 신호의 불완전한 합성
    • 섹터/산업 비중 고려 불가능

깔때기 모양이 역방향인 이유?

정상: 100 (크다) → 200 (중간) → 300 (작음) → 400 (매우 작음)
실제: 871 → 22 → 5 → 19 (거꾸로, 비논리적)

원인: 1. Seedling이 기본값 → 자동 할당되므로 높음 2. Budding 상향 프로세스 부재 3. 200→300 자동화 라우팅 없음


강점과 약점

강점 (유지)

Inbox atomic 455개 — 100% ticker, 100% body, insight_type 완비
Profile 15개 — 우수한 합성 설계, NVIDIA 50개 링크 등
Daily pipeline — Telegram/blog/공시 자동 수집, 다원화

약점 (개선 필요)

Unclassified 466개 (44.9%) — 구조 불명확, 라우팅 오류
99.8% Seedling — 상향 흐름 거의 없음, 영구 미성숙
300 단절 — 포트폴리오 전략과 무연결 (<1%)
Rating 부재 — Inbox 445개 중 논증 없음 (1.3% 완성도)
Entities 미사용 — 교차 태깅 4.2%만, 검색 불가능


우선 조치 (ROI 순)

P0 - 즉시 중단 (손해 방지)

1. Tweet/URL capture 자동화 중단
   → 파이프라인 discovery_filter → 220 라우팅 차단
   → 기존 205개는 아카이브
   근거: 정보 밀도 <10%, 유지비 > 가치

P1 - 1주일 (명확성 회복)

1. vault_architect_inbox 로그 분석 (unclassified 원인)
2. 466개 unclassified 재분류 (auto + manual)
3. 117개 unknown maturity 정규화

P2 - 분기 (자동화 강화)

1. Inbox → Profile 합성 자동화 (목표: 월 2-3개)
2. 각 Profile → [[300 포트폴리오]] 연결 구축
3. Entities 태깅 자동화 (기업/기술/지역 NER)

성공 지표 (6개월 로드맵)

지표 지금 목표 의미
Seedling % 83.9% < 70% 상향 흐름 회복
Profile 수 15 25+ 합성 자동화 가동
300 연결 <1% >50% 포트폴리오 통합
직접활용 % 48.7% >60% 투자판단 신뢰도 ↑
Inbox 신규 50/주 70+/주 신호 수집 가속

더 읽기


검증 방법: - Random sampling: 30개 노트 frontmatter + body 분석 - Full scan: 1,038개 metadata 카테고리/태그/필드 분포 - Python scoring: investability (rating + insight + body) 자동 점수

분석자: 볼트 헬스 인스펙터 | 2026-03-24