네오클라우드 5개사 계약/파트너십 심층 분석
네오클라우드 5개사 계약/파트너십 심층 분석 (2026-04-08)
각 사 IR 자료, 어닝콜 트랜스크립트, SEC 파일링, 웹 검색 기반. 교차검증 완료.
1. CoreWeave (CRWV)
1-1. 주요 고객 계약
| 고객 | 계약 규모 | 기간 | 시점 | 핵심 조건 |
|---|---|---|---|---|
| Microsoft | 2025 매출의 67% | 다년 | 기존 | 최대 고객. 단일 고객 집중 리스크 극심 |
| OpenAI | $22.4B | 다년 | 2025.3~9 (3차례 확대) | $11.9B(3월) + $4B(5월) + $6.5B(9월). Microsoft 경유 vs 직접 위탁 병행 |
| Meta | $14.2B | 6년 (+1년 연장옵션) | 2025.9 | 2031년 12월까지. $8.5B GPU 담보 대출의 담보 기반 |
| Core Scientific | ~$1.5B (연 $290M) | 12년 | 2025 | 6개 사이트 ~590MW. 합병 시도 무산 후 임대 계약으로 전환 |
| Perplexity | 미공개 | 미공개 | 2026.3 | 추론 클러스터 전용 |
| 기타 | 다수 소규모 | — | — | Cognition, Cursor, Midjourney, Runway, Cohere, Mistral |
총 백로그: $66.8B (2025년말 기준, 전분기 대비 $11.2B 증가) 계약 구조: ~96%가 take-or-pay (고객이 사용 여부와 무관하게 지불) 평균 계약 기간: 4년 → 5년으로 연장 추세 (2025년)
1-2. GPU/서버 공급
| 공급사 | 역할 | 규모 | 비고 |
|---|---|---|---|
| Dell Technologies | 주력 서버 OEM | $5.2B+ (OEM 파이낸싱) | PowerEdge XE9860(H100), XE9712(GB200), IR7000(GB300). 세계 최초 GB300 납품처 |
| Supermicro | 보조 OEM (감소 중) | 과거 매출의 ~22% | Dell 진입 이후 점유율 하락 |
| NVIDIA | GPU + 전략 투자자 | $2B 투자(지분 11.5%), $6.3B 용량보증 | 미사용 용량 6년간 매입 보장. Rubin/Vera CPU 우선 접근 |
GPU 보유량: ~250,000개 (H100, H200, GB200, GB300) 자체 서버 설계: 없음 — Dell/Supermicro OEM에 의존
1-3. 데이터센터 & 전력
| 지역 | 사이트 수 | 운영 MW | 비고 |
|---|---|---|---|
| 미국 동부 (NJ, PA, VA) | 5+ | 200MW+ | Kenilworth/Weehawken NJ 핵심 허브, Lancaster PA 300MW 확장 계획 |
| 미국 중부 (ND, IL, WY) | 5+ | 250MW+ | Ellendale ND(APLD 임차), Chicago IL |
| 미국 남부 (TX, GA, OK) | 5+ | 300MW+ | Plano TX 250MW, Core Scientific 6개 사이트 590MW |
| 미국 서부 (NV, OR) | 2+ | 소규모 | Las Vegas, Hillsboro |
| 영국 | 2 | 소규모 | Crawley, London Docklands (2024.10~12 가동) |
| 유럽 | 3 | 소규모 | Barcelona 스페인, Norway, Sweden |
| 캐나다 | 2 | 소규모 | Cambridge ON, Saskatchewan 300MW 계획 |
총 운영: 850MW (43개 DC) 총 계약: 3.1GW (2027년까지 가동 예정) 2030 목표: 5GW+ (NVIDIA 협력) 냉각: 2025년 이후 신규 시설 전부 직접 액체냉각, ~130kW/랙
1-4. 어닝콜 수주 내용 (Q4 2025, 2026.02.26)
- $66.8B 백로그 — 전분기 대비 $11.2B 증가
- $1M+ 연간 약정 고객 수 ~150% 증가
- Q4에 역대 최다 신규 예약 인스턴스 고객 확보
- $1M+ 고객의 80%가 스토리지 제품도 채택
- 2026 CapEx $30~35B — "계약된 수요에 투자하는 것, 투기적 구축 아님"
1-5. 경쟁사 대비 차별점
- 규모 1위: GPU 250K, 850MW, $66.8B 백로그 — 네오클라우드 중 압도적
- NVIDIA 용량보증: 미판매 용량을 NVIDIA가 6년간 매입 → 유휴 리스크 제거
- 프로젝트파이낸스 모델: GPU를 담보로 투자등급 대출(A3) — 전통 인프라처럼 자금 조달
- 가격: 하이퍼스케일러 대비 12~60% 저렴, 베어메탈 Kubernetes로 가상화 오버헤드 제거
2. Nebius (NBIS)
2-1. 주요 고객 계약
| 고객 | 계약 규모 | 기간 | 시점 | 핵심 조건 |
|---|---|---|---|---|
| Microsoft | $17.4B~$19.4B | 5년 | 2025.9 | 기본 $17.4B + 옵션 $2B. NJ/KC/아이슬란드/영국/이스라엘 배치 |
| Meta | $27B | 5년 | 2026.3 (2차례) | 1차 $3B(2025.12) + 2차 $24B(2026.3). NVIDIA Vera Rubin 기반. 2027 초 납품 시작 |
| 기타 | 미공개 | 다수 | — | AI 네이티브 스타트업 "수만 GPU 규모" 주문 |
총 백로그: ~$46B (Microsoft $19.4B + Meta $27B) 계약 추세: Q4에 12개월+ 장기 계약이 Q3 대비 2배, 평균 판매가 50%+ 상승
2-2. GPU/서버 공급
| 항목 | 내용 |
|---|---|
| 자체 설계 | 서버·랙·냉각·네트워킹 전부 자체 설계 (Yandex 엔지니어링 유산) |
| GPU 조달 | NVIDIA 직접 + OEM 병행 |
| NVIDIA 관계 | $2B 투자(8.3% 지분), 2030년까지 5GW NVIDIA 시스템 배포 협력 |
| GPU 라인업 | H100, H200, B200, B300, GB200 NVL72, GB300 NVL72 전 라인 |
| 배포 중 Blackwell | 22,000+ Blackwell GPU 운영 중 |
| 차세대 | Vera Rubin 우선 접근권 확보 (Meta 계약 기반) |
핵심 차별점: OEM 의존 없이 자체 하드웨어 설계 → NVIDIA 신칩 조기 도입 가능, 커스텀 최적화
2-3. 데이터센터 & 전력
| 위치 | 용량 | 상태 | 전력/냉각 |
|---|---|---|---|
| Mäntsälä, 핀란드 (소유) | 75MW (25→75MW 확장) | 운영 중 | PUE 1.1, 열회수(2,500가구), 300MW까지 확장 가능 |
| Lappeenranta, 핀란드 (소유, 신규) | 310MW | 2027 가동 | $10B 투자, 100에이커, 밀폐형 액체냉각 |
| Vineland, NJ, 미국 | 300MW (단계적) | 2025 여름~ | 자사 설계 빌드 |
| Kansas City, MO, 미국 | 40MW (5MW 초기) | 운영 중 | Patmos 시설 임차 |
| London, 영국 | 소규모 | 운영 중 | Ark DC 코로케이션 |
| Paris, 프랑스 | 소규모 | 운영 중 | Equinix PA10 코로케이션 |
| Béthune, 프랑스 (신규) | 240MW | 계획 중 | 자사 빌드 |
| 이스라엘 | 22MW → 64MW | 2026 Q3 | Mega Or 임차 |
| Keflavik, 아이슬란드 | 10MW | 배포 중 | 100% 지열/수력 재생에너지 |
총 운영: ~170MW (2025년말) 2026 목표: 800MW~1GW (5~6배 확장) 계약 전력: >3GW 데이터센터 수: 7개 → 16개 (2026년말)
2-4. 어닝콜 수주 내용 (Q4 2025, 2026.02.12)
- 핵심 AI 클라우드 +830% YoY, +63% QoQ
- "만드는 것마다 다 팔린다" — UK/이스라엘 클러스터 오픈 전 선판매 완료
- 12개월+ 계약 건수 Q3 대비 2배, ASP(평균 판매가) 50%+ 상승
- 2026 CapEx $16~20B, 60%는 고객 선수금 + 자체 현금으로 충당
- 추론 수요가 학습 수요 추월 시작
2-5. 경쟁사 대비 차별점
- 유럽 주권AI: EU 본사(암스테르담), 핀란드/프랑스/아이슬란드 DC — 미국 종속 없는 유일한 대형 네오클라우드
- 풀스택 소프트웨어: 단순 GPU 임대가 아니라 자체 오케스트레이션, 추론 엔진("Token Factory"), 서버리스 컴퓨팅 제공
- 자체 HW 설계: Yandex 1,300명 엔지니어 보유, OEM 없이 랙부터 네트워킹까지 설계
- $46B 백로그: MS+Meta 합산 — CoreWeave($66.8B)에 이어 2위
3. Applied Digital (APLD)
3-1. 주요 고객 계약
| 고객 | 계약 규모 | 기간 | 사이트 | 핵심 조건 |
|---|---|---|---|---|
| CoreWeave | ~$11B | 15년 NNN | PF1 (Ellendale, ND) 400MW | CoreWeave가 100% 임차. 전력·냉각·유지보수 임차인 부담 |
| 투자등급 하이퍼스케일러 (Oracle 추정) | ~$5B | 15년 NNN | PF2 (Harwood, ND) 200MW | 2025.10 발표. 추가 800MW ROFR(우선매수권) 보유 |
| Macquarie Asset Mgmt | $5B 선호주 | 지속 | 프로젝트 단위 | MW당 $2.25M. $900M 인출 완료. 장비 대출 $100M 추가 |
총 계약 가치: ~$16B+ (15년 기준) 사업 본질: GPU 클라우드가 아닌 AI 데이터센터 부동산 개발사. DLR/EQIX에 더 유사.
3-2. GPU/서버 공급
| 항목 | 내용 |
|---|---|
| HPC 호스팅 | GPU를 직접 보유 안 함 — 임차인(CoreWeave, Oracle)이 자체 GPU 배치 |
| ChronoScale (클라우드 스핀아웃) | NVIDIA H100 + Blackwell 보유. NVIDIA Elite Partner 지위 |
| NVIDIA 관계 | 2024.9 $160M 투자 참여 → 2025 Q4 전량 매도 완료. Elite Partner는 유지 |
| OEM | 미공개 (Supermicro 추정) |
3-3. 데이터센터 & 전력
| 사이트 | 위치 | 용량 | 상태 | 비고 |
|---|---|---|---|---|
| Polaris Forge 1 | Ellendale, ND | 400MW (→1GW+) | Bldg1 100MW 운영, Bldg2 150MW 2026, Bldg3 150MW 2027 | CoreWeave 250MW 임차 |
| Polaris Forge 2 | Harwood, ND | 280MW (→1GW) | 2025.9 착공, 2026~27 가동 | $3B 투자, $2.15B 프로젝트 채권 |
| Jamestown | Jamestown, ND | 106MW | 풀 가동 | 레거시 호스팅 |
| Iowa | 미정 | 200MW | 계획 | — |
| Deuel County | SD | 430MW | 제안 | $수십억 |
총 운영: 286MW 총 파이프라인: 1,310MW+ 전력원: Minnkota Power (풍력 중심), Cass County Electric
3-4. 어닝콜 수주 내용 (Q2 FY2026, 2026.01.07)
- PF1 Building 1 (100MW) "Ready for Service" 달성 (2025.11)
- "추가 하이퍼스케일러와 3번째 캠퍼스 고급 협의 중"
- CEO: "5년 내 $1B NOI 목표"
- 리스 매출 본격화 전 fit-out(인테리어 공사) 매출이 마진 왜곡 유발 중
3-5. 경쟁사 대비 차별점
- 15년 NNN 리스: 임차인이 모든 운영비 부담 → 안정적 현금흐름 (리스 본격화 후)
- 프로젝트파이낸스: 캠퍼스별 별도 법인 → 모회사 희석 최소화
- Macquarie 파트너십: $5B 선호주로 자기자본 최소 투입 (지분 85%+ 유지)
- North Dakota 전력: 서늘한 기후 + 풍력 기반 저렴한 전력
4. Iris Energy (IREN)
4-1. 주요 고객 계약
| 고객 | 계약 규모 | 기간 | 시점 | 핵심 조건 |
|---|---|---|---|---|
| Microsoft | $9.7B | 5년 | 2025.11 | Childress TX 200MW IT 부하. 각 트랜치 20% 선불→24개월 후 크레딧 차감 |
| Dell Technologies | $5.8B | 공급 계약 | 2025.11 | GB300 GPU 서버 납품. 트랜치별 수령 후 30일 내 결제 |
| Together AI | 미공개 | 다년 | — | AI 학습/추론 |
| FluidStack | 미공개 | 다년 | — | 클라우드 서비스 |
| Fireworks AI | 미공개 | 다년 | — | 클라우드 서비스 |
계약 ARR: $2.3B (Q2 FY26 기준) → 목표 $3.7B (2026년말) 현재 AI 실매출: $17.3M/분기 (전체의 9.4%) — 계약과 실매출 간 큰 갭 존재
4-2. GPU/서버 공급
| 항목 | 내용 |
|---|---|
| 주력 OEM | Dell Technologies (단독) — $5.8B 공급 계약 |
| GPU 종류 | NVIDIA GB300 (Blackwell Ultra) — Microsoft 계약용 |
| 추가 구매 | 50,000 NVIDIA B300 (2026.3 발표, $6B ATM으로 자금 조달) |
| 총 GPU 목표 | 150,000개 (2026년말) |
| NVIDIA 관계 | 직접 투자 없음. 장비 구매자 관계 |
| 파이낸싱 | $3.6B GPU 전용 파이낸싱 (<6% 금리) + MS 선불금 $1.94B |
GPU 자금 구조: MS 선불 $1.94B + GPU 파이낸싱 $3.6B = GPU capex의 95% 커버
4-3. 데이터센터 & 전력
| 사이트 | 위치 | 용량 | 상태 | 전력/냉각 |
|---|---|---|---|---|
| Childress | TX | 750MW | 650MW 통전, Horizon 1 (75MW AI동) 2025 H2 완공 | ERCOT 345kV, 풍력/태양광 PPA 2.9¢/kWh, 액체냉각 200kW/랙, PUE 1.05~1.10 |
| Sweetwater 1 | TX | 1,400MW | 건설 중, 2026.4 변전소 통전 | ERCOT, 재생에너지, 700K+ GPU 설계 |
| Sweetwater 2 | TX | 600MW | 계획 | ERCOT |
| Oklahoma | OK | 1,600MW | 개발 (2,000에이커) | — |
| Mackenzie | BC, Canada | 80MW | 운영 중 | BC Hydro 수력 |
| Prince George | BC, Canada | 50MW | 운영 중 | 수력 |
| Canal Flats | BC, Canada | 30MW | 운영 중 | 수력 |
총 운영: 810MW 총 파이프라인: 4.5GW 핵심 에너지 자산: 텍사스 ERCOT 직결 + 캐나다 수력 = 업계 최저 수준 전력비(2.9~3.5¢/kWh)
4-4. 어닝콜 수주 내용 (Q2 FY2026, 2026.02.05)
- AI 클라우드 매출 $17.3M (전체의 9.4%) — Q1 $7.3M에서 2.4배 증가
- ARR $2.3B 계약 완료, $3.7B 목표로 상향
- "수요가 제약 아니다" — GPU 배치 속도가 제약
- Microsoft 선불금 수령 시작, GPU 트랜치별 Dell 납품 진행 중
- BTC 채굴 해시레이트 52 EH/s에서 확장 중단 → 전력을 AI로 재배분
4-5. 경쟁사 대비 차별점
- 전력 비용 최저: 2.9¢/kWh (풍력/태양광 PPA) — 업계 평균 7~10¢의 1/3
- 4.5GW 전력 포트폴리오: 현재 810MW 운영, 나머지는 미래 확장 옵션 — "전력이 곧 해자"
- 수직 통합: 자사 변전소 소유 → 전력 확보 리드타임 단축
- BTC 현금흐름: 전환 기간 동안 BTC 채굴이 운영 자금 제공
5. Kingsoft Cloud (KC)
5-1. 주요 고객 계약
| 고객 | 계약 규모 | 기간 | 비고 |
|---|---|---|---|
| Xiaomi | RMB 11.3B (~$1.6B) | 3년 (2025~27) | 유일한 전략적 클라우드 파트너. MiMo LLM, IoT, SU7/YU7 자율주행, 엔터프라이즈 AI |
| Kingsoft Corp (모회사) | 미공개 | 지속 | WPS Office AI 기능 → KC 인프라에서 구동 |
| 중국 LLM 6개사 | 미공개 | 미공개 | 상위 10대 독립 LLM 벤처 중 6개 (이름 비공개) |
| 금융/정부/헬스케어 | 미공개 | 프로젝트 | 엔터프라이즈 클라우드 30.6% |
생태계 매출 비중: Q4 2025 RMB 804M = 전체의 29% (+63% YoY) 외부 고객: 전체 매출의 ~70% — 샤오미 의존도 축소 중 Goldman Sachs 전망: 샤오미 AI 투자 RMB 7B(2025) → RMB 10B(2026), 계약 갱신 시 +10~15% 상향 예상
5-2. GPU/서버 공급
| 항목 | 내용 |
|---|---|
| 현재 주력 | NVIDIA H20 (중국 수출용 고성능 GPU) |
| 조달 방식 | 유통상 경유 추정 (NVIDIA 직접 관계 미확인) |
| H20 재고 | 2024 Q3부터 선제적 비축 — 2025.4 수출규제 대비 |
| 국산칩 전환 | "국산 칩 기반 DeepSeek 풀 배포 완료" 발표, 구체적 칩 브랜드 미공개 |
| Huawei Ascend | KC의 직접 채택 공식 발표 없음. 업계 트렌드로 중장기 가능성 |
| 서버 수량 | ~101,500대 (2025년말) |
| NVIDIA 관계 | 직접 투자 없음. H20 수입 의존 |
칩 리스크: H20 수출규제(2025.4~7 중단) 시 주가 18% 급등/급락. 국산칩 전환은 진행 중이나 성능 격차 존재.
5-3. 데이터센터 & 전력
| 위치 | 유형 | 비고 |
|---|---|---|
| Beijing | 자사 IDC + 임차 | 핵심 허브 |
| Shanghai | 임차 | — |
| Guangzhou | 임차 | — |
| Hangzhou | 임차 | — |
| Yangzhou | 임차 | — |
| Tianjin | 임차 | — |
| Chengdu | 임차 | — |
| Singapore | 임차 | 해외 유일 거점 |
MW 단위 미공개 — 중국 클라우드사 특유의 비공시 관행 IDC 비용: FY2025 RMB 3,113M (+7.7% YoY) — 서버/랙 임차 비용 CapEx: FY2025 RMB 4,994M, 2026 목표 >RMB 10B (2배). 50%는 고객 선수금으로 충당 계획
5-4. 어닝콜 수주 내용 (Q4 2025, 2026.03 발표)
- AI 총빌링 Q4 RMB 926M (+95% YoY) — 퍼블릭 클라우드의 49%
- "추론 수요가 전체 파이프라인의 50%+ 차지" — 학습보다 마진 좋음
- 비생태계 Top 5 고객 +44% YoY 성장
- StarFlow 플랫폼에 MCP(Model Context Protocol) 추가 — AI 에이전트 개발 지원
- CEO: "자체 LLM 개발 안 한다. 중립 플랫폼으로 모든 오픈소스 모델 지원"
5-5. 경쟁사 대비 차별점
- 중립 클라우드: 자체 LLM 없음 → 알리바바(Qwen)/텐센트(Hunyuan)/바이두(ERNIE)와 달리 고객과 경쟁 안 함
- 샤오미 생태계 독점: 샤오미의 유일한 전략적 클라우드 → 샤오미 AI/EV/IoT 성장에 직결
- 밸류에이션: P/S 3.0x로 미국 동종(8~58x) 대비 70~95% 할인
- DeepSeek 수혜: 중국 AI 모델 글로벌 점유율 15%(2025.11) — 추론 인프라 수요 폭발
6. 계약/파트너십 종합 비교
고객 계약 규모 순위
| 순위 | 기업 | 총 백로그/계약 | 최대 단일 계약 | 계약 기간 |
|---|---|---|---|---|
| 1 | CRWV | $66.8B | OpenAI $22.4B | 5년 평균 |
| 2 | NBIS | ~$46B | Meta $27B | 5년 |
| 3 | APLD | ~$16B | CoreWeave $11B | 15년 NNN |
| 4 | IREN | ~$9.7B (+@) | Microsoft $9.7B | 5년 |
| 5 | KC | ~$1.6B (샤오미 3년) | 샤오미 RMB 11.3B | 3년 |
GPU 공급 관계 강도
| 순위 | 기업 | NVIDIA 관계 | 공급 안정성 |
|---|---|---|---|
| 1 | CRWV | $2B 투자 + $6.3B 용량보증 + 지분 11.5% | 🟢 최고 (미판매분 매입 보장) |
| 2 | NBIS | $2B 투자 + 지분 8.3% + 자체 HW 설계 | 🟢 높음 (Vera Rubin 우선) |
| 3 | APLD | Elite Partner (지분 매도 완료) | 🟡 중간 (자체 GPU 비보유) |
| 4 | IREN | Dell 경유 $5.8B 공급 계약 | 🟡 중간 (Dell 의존) |
| 5 | KC | 직접 관계 없음. 유통상 경유, 수출규제 리스크 | 🔴 낮음 (H20 수입 의존) |
전력 인프라 비교
| 기업 | 운영 MW | 파이프라인 | 전력 비용 | 에너지원 |
|---|---|---|---|---|
| CRWV | 850 | 3.1GW → 5GW+ | 미공개 | 혼합 (유럽은 100% 재생) |
| NBIS | 170 | 3GW+ 계약 | 미공개 | 핀란드 풍력, 아이슬란드 지열 |
| APLD | 286 | 1.3GW+ | 미공개 | ND 풍력 중심 |
| IREN | 810 | 4.5GW | 2.9¢/kWh (업계 최저) | TX 풍력/태양광, BC 수력 |
| KC | 미공개 | 미공개 | 미공개 | 중국 전력망 |
핵심 파트너십 네트워크
NVIDIA ──── $2B 투자 ──→ CRWV (11.5% 지분)
│ │
├── $2B 투자 ──→ NBIS (8.3% 지분)
│ │
└── Elite Partner ──→ APLD (지분 매도)
│
Microsoft ─── 67% 매출 ──→ CRWV
├── $17~19B ──────────→ NBIS
└── $9.7B ────────────→ IREN
Meta ─── $14.2B ─────────→ CRWV
└── $27B ──────────────→ NBIS
OpenAI ─── $22.4B ───────→ CRWV
Dell ─── 서버 OEM ────────→ CRWV (주력)
└── $5.8B 공급 ─────────→ IREN (단독)
Macquarie ── $5B 선호주 ──→ APLD
Xiaomi ── RMB 11.3B ──────→ KC (독점)
7. AI 인프라 수요 맥락: 네오클라우드 투자의 전제 검증
7-1. AI 활용 현황 — Anthropic Economic Index
Anthropic이 Claude 사용 데이터를 분석한 경제 지표 (2025.9, 2026.1, 2026.3 보고서):
| 항목 | 수치 | 출처 |
|---|---|---|
| 코딩/수학 작업 비중 | Claude.ai 대화의 33%, API 트래픽의 50% | 2026.1 보고서 |
| 최다 단일 작업 | "소프트웨어 오류 수정" — 전체의 6% | 2026.1 보고서 |
| 기업 API 업무 관련 비중 | 74% (자동화 75%, 명령형 64%) | 2026.3 보고서 |
| 소비자 업무 관련 비중 | 46% (증강형 52%로 상승) | 2026.3 보고서 |
| 교육 작업 비중 | 9%(2025.1) → 15%(2025.11) 증가 | 2026.1 보고서 |
| 고유 업무 유형 수 | 3,000+ (상위 10개가 전체의 24~32%) | 2026.1 보고서 |
핵심 시사점: AI 활용이 코딩에 집중(50%)되어 있지만, 3,000+ 업무 유형으로 분산 확대 중. 기업 API의 75%가 자동화 파이프라인 = GPU 클라우드의 안정적 추론 수요 기반. 교육·분석 등 비코딩 활용이 빠르게 증가하며 추론 수요 저변 확대.
7-2. 추론 vs 학습 GPU 수요 분기
| 연도 | 추론 비중 | 학습 비중 | 출처 |
|---|---|---|---|
| 2023 | ~33% | ~67% | Deloitte |
| 2025 | ~50% | ~50% | Deloitte/McKinsey |
| 2026 | ~65-67% | ~33-35% | Gartner |
| 2029 | 65%+ | <35% | Gartner 전망 |
추론이 학습을 추월한 시점: 2025년 하반기 (Deloitte 확인). 2026년 초 AI 클라우드 인프라 지출의 55%가 추론 워크로드.
추론 비용 하락 속도: GPT-3.5급 성능 기준 2022.11~2024.10 사이 280배 하락 (Stanford AI Index). 연간 200배 속도. 단, 프론티어 추론 모델(o3/Sonnet급) 가격은 안정적 — 하락 안 함.
GPU 유형별 최적화: | 용도 | 최적 GPU | 특징 | |------|---------|------| | 학습 | H100 SXM (80GB HBM3, 3TB/s) | 대규모 배치 기울기 연산에 최적 | | 추론 | L40S (48GB GDDR6, 저비용/토큰) | 추론 처리량/비용 최적화 | | 범용 | B200/GB200 (Blackwell) | 학습+추론 겸용 설계 | | 중국 | H20/H800 (수출규제 버전) | 성능 제한, 가격 상승 |
네오클라우드 영향: 추론 비중 증가 = 지속적 GPU 가동률 확보. 학습은 간헐적(프로젝트 단위)이지만 추론은 24/7 상시 가동 → 수익 예측성 향상. CRWV/NBIS의 take-or-pay 계약 구조와 부합.
7-3. 로컬 LLM 확산이 클라우드 수요를 줄이는가?
Ollama 채택 규모: - 월간 다운로드: 5,200만 회 (2026 Q1) — 2023 Q1의 10만 회 대비 520배 증가 - GitHub 스타: 154,856개 (2025.11) - HuggingFace GGUF 모델: 135,000개 (3년 전 ~200개) - Llama 3.1 단일 모델 풀: 1.12억 회
결론: 로컬 LLM은 클라우드 수요를 줄이지 않는다. 시장을 분기시킨다.
| 워크로드 | 로컬/엣지 | 클라우드 |
|---|---|---|
| 코드 자동완성, 초안 | ✅ (Ollama, LM Studio) | — |
| 개인정보 민감 데이터 | ✅ | — |
| 프론티어 추론 (70B+) | — | ✅ |
| 대규모 배치 추론 | — | ✅ |
| 파인튜닝/학습 | — | ✅ |
| 실시간 IoT/제조 | ✅ (엣지) | — |
- 7B~13B 모델: 소비자 GPU(RTX 4090)나 Apple Silicon에서 로컬 구동 가능
- 70B+ 모델, 멀티모달, 프론티어 추론: VRAM 부족으로 클라우드 필수
- 기업 패턴(2025~26): 하이브리드 아키텍처가 지배적 — 엣지에서 실시간 추론, 클라우드에서 학습 + 복잡한 추론
- 하이브리드 배포 기업: 클라우드 비용 30~50% 절감, 응답 속도 40% 향상
시장 규모 비교: - 온디바이스 AI: $1.9B (2025) — 10년 후 10배 성장 전망 - 엣지 AI: $24.9B (2025) → $118.7B (2033), CAGR 21.7% - 클라우드 AI CAGR: 28.5% — 절대 금액 기준으로 엣지보다 빠르게 성장
OpenClaw 같은 로컬 AI 시스템의 의미: 오케스트레이션은 로컬이지만, 실제 추론 API 호출은 Anthropic/OpenAI 클라우드 → 네오클라우드 GPU 인프라로 연결. 로컬 시스템이 확산될수록 클라우드 API 호출량이 증가하는 구조.
7-4. 하이퍼스케일러 AI CapEx — 수요 폭발의 증거
| 기업 | 2025 실적 | 2026 가이던스 | YoY |
|---|---|---|---|
| Amazon | $131B | ~$200B | +53% |
| Alphabet/Google | ~$85B | $175~185B | +106% |
| Microsoft | ~$80B | $120B+ | +50% |
| Meta | $66~72B | $115~135B | +74% |
| Oracle | — | $50B | 신규 |
| 합계 | ~$350~450B | $660~700B | +56% |
- Goldman Sachs: 2025~2027 하이퍼스케일러 CapEx 합산 $1.15조
- 이 중 ~75%($450~500B)가 AI 인프라 전용
- Microsoft 단일 분기 CapEx: Q1 2026 $34.9B (+74% YoY) — 역대 최대
7-5. 네오클라우드 시장 규모
| 연도 | 네오클라우드 매출 | 성장률 | 출처 |
|---|---|---|---|
| 2024 | ~$7.5B | — | Synergy Research |
| 2025 | $24~25B | +223% | Synergy Research |
| 2026 | $35B | +42% | Mordor Intelligence |
| 2030 | $180B | CAGR 46.4% | Synergy Research |
| 2031 | $237B | — | Mordor Intelligence |
- 네오클라우드는 전체 AI 인프라 지출의 약 5~8% — 하이퍼스케일러 대비 아직 소규모
- 그러나 성장률은 하이퍼스케일러(+56% YoY) 대비 네오클라우드(+223% YoY)가 4배 빠름
- 북미 시장 점유율 41%, $3.2B VC 유입 (2025)
7-6. DeepSeek와 Jevons Paradox
DeepSeek 실제 비용: $294K는 RL 미세조정 비용만. 전체 개발 비용 ~$5.87M (2,048 H800 GPU로 2개월, 2.79M GPU시간). 그래도 미국 프론티어 모델($100M+)의 1/20.
시장 초기 반응: NVIDIA 주가 하루 -17% (역대 최대 시총 감소)
실제 결과 — Jevons Paradox 확인: | 기업 | DeepSeek 발표 전 CapEx | DeepSeek 발표 후 CapEx | |------|----------------------|----------------------| | Meta | 2025 $38~40B 계획 | $60~65B로 상향 | | Alphabet | $52.5B → $91~93B | 3차례 상향 | | Amazon | $78B | $125B (+61%) | | Microsoft | Q1 2026 $34.9B | +74% YoY |
Jevons Paradox 작동 메커니즘: 1. 추론 비용 하락 → 더 많은 활용 사례가 경제적으로 가능해짐 2. 더 많은 모델이 배포 가능해짐 → 더 많은 사용자와 앱이 AI 채택 3. 호출당 비용 하락 → 개발자가 파이프라인에 AI 단계를 더 많이 삽입 4. 결과: 쿼리당 GPU 소비 감소에도 총 GPU 소비는 증가
네오클라우드 영향: DeepSeek 효율성이 수요를 줄이지 않고 확대. 저비용 추론 → 중소기업/스타트업도 AI 채택 가능 → 하이퍼스케일러 외 네오클라우드 수요 증가. 특히 Kingsoft Cloud가 "DeepSeek 풀 배포 완료"를 발표한 직후 AI 빌링 +95% YoY 기록.
7-7. GPU 수급 현황 — 이중 시장
| 세그먼트 | 가격 추세 | 상황 |
|---|---|---|
| 계약 엔터프라이즈 (take-or-pay) | 상승 | Blackwell 2026년 8~9월까지 풀 예약. 360만 유닛 백로그 |
| H100 스팟 시장 | 64% 하락 ($8/hr → $2~4.5/hr) | 300+ 클라우드 제공업체 진입으로 공급 과잉 |
| HBM 메모리 | 20% 인상 예정 (2026 초) | SK Hynix/Samsung 병목 |
두 가지 완전히 다른 시장이 공존: - 프리미엄 계약 시장(CRWV/NBIS 영역): 수요 > 공급, 가격 상승 - 범용 스팟 시장: 공급 과잉, 가격 붕괴 — 소규모 네오클라우드 생존 위협
투자 시사점: CRWV/NBIS처럼 MS/Meta/OpenAI와 장기 take-or-pay 계약을 확보한 기업은 스팟 시장 붕괴에 면역. 그러나 스팟 의존 소규모 GPU 클라우드는 마진 압박 심화.
8. 최종 판단 — 계약/파트너십 관점의 투자 등급
| 기업 | 계약 안정성 | GPU 공급 안정성 | 전력 확보 | 수요 구조적 위치 | 종합 |
|---|---|---|---|---|---|
| CRWV | 🟢 $66.8B 백로그, 96% take-or-pay | 🟢 NVIDIA 11.5%+용량보증 | 🟢 3.1GW 계약 | 🟢 추론+학습 양면 | A |
| NBIS | 🟢 $46B 백로그 (MS+Meta) | 🟢 NVIDIA 8.3%+자체HW | 🟡 170MW→1GW 실행 리스크 | 🟢 유럽 주권AI 독점 | A- |
| IREN | 🟡 $9.7B MS+$2.3B ARR | 🟡 Dell 단독 의존 | 🟢 4.5GW, 2.9¢/kWh | 🟡 BTC→AI 전환 중 | B+ |
| APLD | 🟡 $16B (15년이지만 CRWV 집중) | 🟢 자체 GPU 불필요 | 🟡 1.3GW 파이프라인 | 🟡 부동산, GPU 아님 | B |
| KC | 🟡 샤오미 $1.6B/3년 | 🔴 H20 수입 의존, 규제 리스크 | 🔴 미공개 | 🟡 중국 내수, 저밸류 | B- |
데이터 출처: 각 사 10-K/6-K, IR 프레젠테이션, Q4 2025/Q2 FY26 어닝콜, SEC 8-K, BofA/Goldman/Bernstein 리서치, Anthropic Economic Index(2026.1/3), Deloitte TMT Predictions 2026, Stanford AI Index, Synergy Research, Mordor Intelligence, Epoch AI 교차검증: 계약 금액은 IR 공시 + 뉴스 보도 최소 2개 소스 대조