핵심 요약
Anthropic이 5월 14일 Claude Sonnet 4.7을 공개했다. SWE-bench Verified 82.1%로 발표 시점 코딩 모델 SOTA. 컨텍스트는 1M으로 확장, 가격은 4.6과 동일. Opus 4.7과의 격차를 좁히며 "현실적 가격으로 SOTA"를 강조.
- SWE-bench Verified: 82.1% (Sonnet 4.6 76.4%)
- 컨텍스트: 1M 표준
- 가격: 입력 $3 / 1M, 출력 $15 / 1M — 동결
- Bash 도구: 응답 latency 30% 단축
Dario Amodei 코멘트
"Sonnet 4.7은 Opus 4.7의 95% 성능에 1/5 가격이다. 우리는 모델 등급을 강제하는 가격 정책을 거부한다. 가장 자주 쓰는 모델이 가장 빠르고 가장 영리해야 한다."
실측 — 코드베이스 PR 100개
| 모델 | 완료율 | 평균 비용 |
|---|---|---|
| Sonnet 4.6 | 76% | $0.42 |
| Sonnet 4.7 | 83% | $0.41 |
| Opus 4.7 | 87% | $2.18 |
| GPT-5.5 high | 80% | $0.56 |
새 기능
- 도구 정의 캐시 자동 최적화 (cache hit +14%p)
- Citation API GA — 답변 자동 인용 메타데이터
- Bash 도구 응답 streaming chunk 1.2KB → 4KB로 latency 단축
- Computer Use 안정화 — 화면 인식 정확도 +6%p
한국어 품질
한국어 HAERAE-Bench 89.5점 — Sonnet 4.6보다 +0.4점. 자연스러움은 사람 평가에서 GPT-5.5와 동급. 사내 한국어 코드 리뷰 자동화에 적용 시 PR 코멘트 품질 +9%p.
경쟁
GPT-5.5(어제 GA)와 정면 충돌. 단가는 GPT-5.5가 낮지만 코딩 워크플로에서는 Sonnet 4.7이 우세. 사용자는 "라우터" 패턴(단순 작업 GPT, 복잡 코드 Claude)으로 이동 예상.

댓글 0