본문 바로가기
클라우드2026년 5월 3일3분 읽기

AWS, Bedrock에 Claude 4.7 Opus 1M 컨텍스트 정식 — 한국 리전 동시 오픈

YS
김영삼
조회 1331
AWS, Bedrock에 Claude 4.7 Opus 1M 컨텍스트 정식 — 한국 리전 동시 오픈

핵심 요약

AWS가 5월 2일(현지) Bedrock에 Claude 4.7 Opus의 1M(100만 토큰) 컨텍스트 모델을 정식 제공한다고 발표했다. 서울 리전 ap-northeast-2가 1차 오픈 리전에 포함됐다.

  • 모델 ID: anthropic.claude-opus-4-7-1m-v1:0
  • 가용 리전: 서울·도쿄·버지니아·아일랜드·시드니 (5곳 동시)
  • 컨텍스트: 입력 1M 토큰 / 출력 200K 토큰
  • 가격: 입력 $5/M, 출력 $25/M (직전 대비 50% 인하)

왜 한국 리전 1차 오픈인가

AWS 서울 리전은 Bedrock 신규 모델 1차 오픈 대상이 거의 없었다. 이번 동시 오픈은 (1) 한국 고객 데이터 주권 요구, (2) 5월 14일 AWS Summit Seoul, (3) Anthropic의 한국 사용자 비중 급증(전체 3위)이 맞물린 결과다.

1M 컨텍스트로 가능한 것

유형가능 입력 규모
코드베이스중형 모노레포 전체 (50만 줄)
법률 문서3,000페이지 + 판례 100건
의료 기록환자 1명 평생 기록 + 가이드라인
금융 분석10년치 분기보고서 + 컨퍼런스콜

프롬프트 캐싱

1M 모델에선 프롬프트 캐싱이 사실상 필수. 캐시 적중 시 90% 할인 적용된다.

// 시스템 프롬프트·지식베이스를 캐싱
const response = await bedrock.invokeModel({
  modelId: 'anthropic.claude-opus-4-7-1m-v1:0',
  body: JSON.stringify({
    system: [
      { type: 'text', text: HUGE_KB, cache_control: { type: 'ephemeral' } }
    ],
    messages: [/* ... */],
  }),
})

한국 도입 사례

  • 네이버: 검색 결과 페이지 LLM 보조에 도입 검토
  • 카카오뱅크: 여신 심사 보조 — 신용평가서 + 거래내역 한 번에
  • 법무법인 광장: 판례 검색·요약
  • LG CNS: 자체 RAG 파이프라인의 컨텍스트 백엔드 교체

제한 사항

1M 풀 컨텍스트 사용 시 응답 지연이 평균 28~42초. 실시간 채팅보다는 배치·비동기 워크로드에 적합하다는 평가.

댓글 0

아직 댓글이 없습니다.
Ctrl+Enter로 등록