핵심 요약
xAI가 5월 30일 Grok 4를 발표했다. X 실시간 데이터 학습 + reasoning 강화로 SWE-bench 71%, AIME 68%. 가격 $5/M, X Premium+ 가입자($16/월) 무료. 일반 API는 6월 중 가용.
- 모델: Grok 4 (단일), Grok 4 mini
- SWE-bench: 71%, AIME 2026: 68%
- 가격: $5/M input, $25/M output
- X Premium+ 가입자: 무료 (월 100M 토큰)
- 컨텍스트: 256K
X 실시간 데이터 — 핵심 차별점
Grok은 X 트윗 실시간 학습. 1시간 전 발생한 뉴스·트렌드도 답변. Claude·GPT·Gemini는 1~2일 늦음. 뉴스·트렌드·실시간 이벤트 분석에서 압도적.
벤치마크 비교
| 벤치 | Grok 4 | Claude 4.9 Opus | GPT-5.5 | Gemini 3.5 Pro |
|---|---|---|---|---|
| SWE-bench | 71% | 82.1% | 74.1% | 80.2% |
| AIME 2026 | 68% | 78% | 72% | 74% |
| 실시간 뉴스 정확도 | 94% | 52% | 58% | 61% |
| 한국어 | 72% | 84.2% | 74.1% | 85.8% |
한국 시장 — 한국어 약함
Grok 4 한국어 KMMLU 72%로 글로벌 1위 모델 대비 -14%p. 한국어 사용 시 영어 응답 섞임. 한국 시장에서는 실시간 뉴스 분석·X 기반 트렌드 분석에 한정 사용 예상.
Elon Musk 발언
Musk는 "Grok이 진실에 가장 가깝다. 다른 LLM은 정치적으로 편향됐다"고 주장. 실제로 일부 주제에서 다른 LLM과 다른 응답 패턴 확인. 학계는 "편향 vs 진실의 정의가 다를 뿐"이라고 평가.
가격 정책 — X 가입자 무료
- X Premium+ ($16/월) — Grok 4 무제한, 월 100M 토큰 후 throttle
- API — $5/M input, $25/M output
- X DataPlex (실시간 X 데이터) — 별도 라이선스 $2,000/월
업계 반응
실시간 데이터 강점은 평가하나 일반 LLM 시장에서 Claude·Gemini 대비 명확한 약점. xAI는 차별점을 "real-time + X 통합"으로 좁히는 전략. 1년 매출 목표 $4B, IPO는 2027년 검토.

댓글 0