핵심 요약
OpenAI가 5월 5일 새벽(현지 5/4) GPT-5.5를 공개했다. 1M 컨텍스트, Realtime Voice 모듈 통합, API 가격 50% 인하가 핵심. ChatGPT 무료·Plus 사용자에게는 5월 12일부터 단계적 롤아웃된다.
- 발표 시각: 2026-05-05 03:00 KST (Sam Altman 라이브)
- 컨텍스트: 1M 토큰 (입력) / 256K 토큰 (출력)
- Realtime: Voice + Vision + Tool Use 단일 스트림
- API 가격: 입력 $1.5/M, 출력 $6/M (직전 GPT-5 대비 50% 인하)
달라진 점
- Latent Reasoning: 모든 응답에 기본 적용, 별도 "thinking" 모드 폐지
- Tool Use Native: JSON Schema 없이 자연어로 도구 정의 가능
- Memory 2.0: 사용자별 영속 메모리, 대화 시점 분리 인덱싱
- Code Interpreter v2: 컨테이너 라이프타임 24시간 → 7일
벤치마크
| 벤치마크 | GPT-5 | Claude 4.7 Opus | GPT-5.5 |
|---|---|---|---|
| SWE-bench Verified | 72.4 | 78.1 | 80.6 |
| MMLU-Pro | 84.2 | 83.9 | 87.1 |
| GPQA Diamond | 69.8 | 72.4 | 74.2 |
| 한국어 KMMLU | 72.1 | 75.8 | 78.4 |
가격 비교
| 모델 | 입력 $/M | 출력 $/M |
|---|---|---|
| GPT-5 | 3.0 | 12.0 |
| GPT-5.5 | 1.5 | 6.0 |
| Claude 4.7 Opus | 5.0 | 25.0 |
| Gemini 3 Pro | 2.0 | 8.0 |
Anthropic 대응
Anthropic은 즉시 코멘트하지 않았지만, 업계는 5월 중 Claude Haiku 4.5 추가 인하 또는 Sonnet 4.7 가격 조정이 있을 것으로 본다. Google은 Gemini 3 Flash 무료 한도를 확대한 것으로 5월 5일 오전 응수했다.
한국 사용자
- ChatGPT Plus($20): 5월 12일 자동 업그레이드
- Pro($200): 무제한 컨텍스트 + Realtime 동시 4세션
- Team Edu($25): 한국 초·중·고 단가 별도 협상 진행 중
주의 사항
1M 컨텍스트 사용 시 응답 지연이 평균 35~70초로 길다. 또 메모리 기능 활성 시 누적 토큰이 비용을 증폭시킬 수 있어 OpenAI는 "월 $200 한도 알림"을 기본 ON으로 설정하는 것을 권장했다.

댓글 0