핵심 요약
NVIDIA GTC 2026에서 차세대 Rubin 아키텍처 베타 GPU(R100)가 공개됐다. Blackwell(B200) 대비 추론 효율 2.1배, 동일 토큰 처리당 전력 -42%. HBM4 적층, NVLink 6 GA.
- R100 메모리: 288GB HBM4 (B200 192GB)
- FP8 처리량: 9.8 PFLOPS (B200 4.5)
- NVLink: 1.8TB/s
- 본격 양산: 2026년 11월 예정
Jensen Huang 발언
"Hopper에서 Blackwell까지가 2년이었다. Rubin은 1년. 이 속도가 AI 컴퓨트의 한계 비용을 매년 절반으로 만든다."
경쟁 — AMD MI400
AMD가 같은 주 발표한 MI400은 320GB HBM4, FP8 8.2 PFLOPS. 처리량은 NVIDIA가 우세, 메모리는 AMD가 우세. 가격은 미정이지만 AMD가 30%대 할인 공격 예상.
인프라 영향
| 워크로드 | B200 시간당 | R100 시간당 | 토큰당 비용 |
|---|---|---|---|
| Llama 405B 추론 | $28 | $32 | -31% |
| Sonnet급 학습 | $36 | $42 | -28% |
한국 영향
- SK하이닉스 HBM4 단독 공급 — 2027 매출 가이던스 상향
- 네이버·카카오 인프라 투자 일정 재조정 보고
- NCP·KT클라우드의 GPU 가격 인하 압력

댓글 0