핵심 요약
AWS가 5월 2일(현지) Bedrock에 Claude 4.7 Opus의 1M(100만 토큰) 컨텍스트 모델을 정식 제공한다고 발표했다. 서울 리전 ap-northeast-2가 1차 오픈 리전에 포함됐다.
- 모델 ID:
anthropic.claude-opus-4-7-1m-v1:0 - 가용 리전: 서울·도쿄·버지니아·아일랜드·시드니 (5곳 동시)
- 컨텍스트: 입력 1M 토큰 / 출력 200K 토큰
- 가격: 입력 $5/M, 출력 $25/M (직전 대비 50% 인하)
왜 한국 리전 1차 오픈인가
AWS 서울 리전은 Bedrock 신규 모델 1차 오픈 대상이 거의 없었다. 이번 동시 오픈은 (1) 한국 고객 데이터 주권 요구, (2) 5월 14일 AWS Summit Seoul, (3) Anthropic의 한국 사용자 비중 급증(전체 3위)이 맞물린 결과다.
1M 컨텍스트로 가능한 것
| 유형 | 가능 입력 규모 |
|---|---|
| 코드베이스 | 중형 모노레포 전체 (50만 줄) |
| 법률 문서 | 3,000페이지 + 판례 100건 |
| 의료 기록 | 환자 1명 평생 기록 + 가이드라인 |
| 금융 분석 | 10년치 분기보고서 + 컨퍼런스콜 |
프롬프트 캐싱
1M 모델에선 프롬프트 캐싱이 사실상 필수. 캐시 적중 시 90% 할인 적용된다.
// 시스템 프롬프트·지식베이스를 캐싱
const response = await bedrock.invokeModel({
modelId: 'anthropic.claude-opus-4-7-1m-v1:0',
body: JSON.stringify({
system: [
{ type: 'text', text: HUGE_KB, cache_control: { type: 'ephemeral' } }
],
messages: [/* ... */],
}),
})
한국 도입 사례
- 네이버: 검색 결과 페이지 LLM 보조에 도입 검토
- 카카오뱅크: 여신 심사 보조 — 신용평가서 + 거래내역 한 번에
- 법무법인 광장: 판례 검색·요약
- LG CNS: 자체 RAG 파이프라인의 컨텍스트 백엔드 교체
제한 사항
1M 풀 컨텍스트 사용 시 응답 지연이 평균 28~42초. 실시간 채팅보다는 배치·비동기 워크로드에 적합하다는 평가.

댓글 0