핵심 요약
AMD가 5월 20일 MI400 시리즈를 공식 출시했다. 320GB HBM4, FP8 8.2 PFLOPS. NVIDIA H200 대비 동일 성능에 가격 -28%, 동급 토큰당 비용 -34%. ROCm 7.0과 함께 PyTorch 호환성 대폭 개선.
- MI400: 320GB HBM4, FP8 8.2 PFLOPS
- ROCm 7.0: PyTorch native, vLLM 1.1 호환
- 가격: NVIDIA H200 대비 -28%
- 출하: 2026 6월 시작
Lisa Su CEO 발언
"MI300이 가능성을 증명했다면, MI400은 NVIDIA의 독점이 끝났다는 신호입니다. 우리는 AI 데이터센터 시장의 30% 점유를 향해 가고 있습니다."
벤치마크 — Llama 70B 추론
| NVIDIA H200 | AMD MI400 | |
|---|---|---|
| tok/s | 4,800 | 5,200 |
| p99 latency | 42ms | 40ms |
| 월 임대료(클라우드) | $5,200 | $3,750 |
ROCm 7.0 — 실용성
PyTorch 자동 변환 비율 92%, vLLM/SGLang/llama.cpp 즉시 호환. 1년 전 ROCm 6과 비교해 "CUDA 코드 그대로 이식"이 현실에 가까워짐.
업계 영향
- Microsoft·Meta가 MI400 대량 발주 보도
- NVIDIA Rubin과 가격 경쟁 본격화
- 국내 NCP·KT 등 가격 인하 압박

댓글 0