본문 바로가기
AI2026년 5월 24일2분 읽기

AWS Bedrock 한국 리전 — 6개월 운영 비용·지연 실측

YS
김영삼
조회 422
AWS Bedrock 한국 리전 — 6개월 운영 비용·지연 실측

핵심 요약

AWS Bedrock 서울 리전(ap-northeast-2) GA 후 사내 7개 LLM 서비스 운영. 지연 도쿄→서울로 -72ms 개선, Claude Opus 4.6/Sonnet 4.5 가용성 99.97%. 한국 개인정보 처리에 결정적 — 사후 정리.

1. 지원 모델

  • Anthropic Claude Opus 4.6, Sonnet 4.5, Haiku 4.5
  • Amazon Titan Text Premier
  • Meta Llama 4 70B
  • 임베딩: Titan v2 + Cohere Embed Multilingual

DeepSeek, Mistral은 도쿄 cross-region inference로 fallback.

2. 지연 실측

모델도쿄서울
Haiku 4.5(500 tok)820ms748ms
Sonnet 4.5(2K tok)2.4s2.1s
Opus 4.6(1K tok)3.8s3.5s
Titan embed(batch 64)180ms102ms

3. 비용 — 한국 리전 프리미엄

도쿄 대비 input 3%, output 4% 비쌈. 다만 데이터 전송 비용·VPC endpoint 비용 합치면 한국 내 서비스는 서울이 8% 저렴.

4. 개인정보 처리 — 결정적 이점

개인정보보호법 국외이전 이슈 회피. 의료·금융 PoC 6개월에 3개 통과. 또 KISA ISMS-P 인증 범위 안.

5. 함정

  • Cross-region inference 자동 — 서울 quota 초과 시 도쿄로 무음 라우팅, 데이터 거주성 깨질 수 있음. 명시 disable
  • Guardrails — 한국어 PII 마스킹 v2까지 미진, custom regex로 보강
  • Provisioned Throughput — 서울은 최소 약정 1시간 단위, 도쿄(분단위)와 다름
  • Knowledge Base — OpenSearch Serverless 서울 GA가 일부 기능 후행

댓글 0

아직 댓글이 없습니다.
Ctrl+Enter로 등록