핵심 요약
네이버가 5월 29일 HyperCLOVA X 2.0 출시 6일 전 자체 벤치마크 결과 일부를 공개했다. KMMLU 86.4%로 Gemini 3.5 Pro(85.8%)·Claude 4.9 Opus(84.2%)를 추월. 6월 4일 NAVER AI Now 2026에서 정식 발표.
- 발표일: 2026.6.4 (목) 오후 1시, 코엑스
- 모델: HyperCLOVA X 2.0 Ultra/Standard/Lite
- 컨텍스트: 최대 1M 토큰
- 멀티모달: 이미지·음성·동영상
- 가격: $3.5/M input (Sonnet 4.9 +17%)
자체 공개 벤치마크
| 벤치 | HyperCLOVA X 2.0 | Claude 4.9 Opus | Gemini 3.5 Pro |
|---|---|---|---|
| KMMLU | 86.4% | 84.2% | 85.8% |
| 한국어 SWE-bench | 78.4% | 82.1% (영어) | 80.2% (영어) |
| 한국어 BLEU | 0.82 | 0.71 | 0.79 |
| 한국어 reasoning | 81% | 78% | 83% |
업계 평가 — "검증 필요" 신중론
업계는 네이버 자체 벤치를 신중하게 본다. 외부 평가 기관 결과가 나와야 신뢰 가능. 한 AI 연구자는 "한국어 벤치에서 토종 모델이 글로벌 모델을 앞서는 건 의미 있으나, 실제 서비스 품질은 응답 자연스러움이 결정"이라고 평했다.
네이버 측 추가 공개
- 학습 데이터 — 한국어 800B 토큰, 정부·공공 라이선스 200B 포함
- RLHF — 한국어 1.4M 평가자 피드백
- 안전성 — AI 기본법 사전 영향평가 통과
- 한국 데이터 거주성 — 국내 IDC만 운영
가격 — Sonnet 4.9 압박
Sonnet 4.9 가격($3/M)이 발표된 직후 네이버가 $3.5/M로 책정. 17% 프리미엄을 한국어 품질로 정당화하는 전략. 정부·금융 등 데이터 거주성 의무 분야에서 우위.
예상 반응 — 6/4 당일
- 네이버 주가 — 시간외 +2.1%, 발표 후 추가 상승 예상
- 카카오브레인(11월 출범) — 직접 경쟁 구도 신호
- 국내 기업 — 데이터 거주성 의무 분야에서 HyperCLOVA X 도입 검토
- 외국계 클라우드 — AWS Bedrock 한국 리전 Claude·Sonnet과 경쟁 격화

댓글 0