본문 바로가기
AI2026년 5월 15일2분 읽기

NVIDIA GTC 2026 — Rubin 아키텍처 베타 공개, “Blackwell 2배 효율”

YS
김영삼
조회 1326
NVIDIA GTC 2026 — Rubin 아키텍처 베타 공개, “Blackwell 2배 효율”

핵심 요약

NVIDIA GTC 2026에서 차세대 Rubin 아키텍처 베타 GPU(R100)가 공개됐다. Blackwell(B200) 대비 추론 효율 2.1배, 동일 토큰 처리당 전력 -42%. HBM4 적층, NVLink 6 GA.

  • R100 메모리: 288GB HBM4 (B200 192GB)
  • FP8 처리량: 9.8 PFLOPS (B200 4.5)
  • NVLink: 1.8TB/s
  • 본격 양산: 2026년 11월 예정

Jensen Huang 발언

"Hopper에서 Blackwell까지가 2년이었다. Rubin은 1년. 이 속도가 AI 컴퓨트의 한계 비용을 매년 절반으로 만든다."

경쟁 — AMD MI400

AMD가 같은 주 발표한 MI400은 320GB HBM4, FP8 8.2 PFLOPS. 처리량은 NVIDIA가 우세, 메모리는 AMD가 우세. 가격은 미정이지만 AMD가 30%대 할인 공격 예상.

인프라 영향

워크로드B200 시간당R100 시간당토큰당 비용
Llama 405B 추론$28$32-31%
Sonnet급 학습$36$42-28%

한국 영향

  • SK하이닉스 HBM4 단독 공급 — 2027 매출 가이던스 상향
  • 네이버·카카오 인프라 투자 일정 재조정 보고
  • NCP·KT클라우드의 GPU 가격 인하 압력

댓글 0

아직 댓글이 없습니다.
Ctrl+Enter로 등록