AWS Bedrock 한국 리전 — 6개월 운영 비용·지연 실측 | 기술노트

핵심 요약

AWS Bedrock 서울 리전(ap-northeast-2) GA 후 사내 7개 LLM 서비스 운영. 지연 도쿄→서울로 -72ms 개선, Claude Opus 4.6/Sonnet 4.5 가용성 99.97%. 한국 개인정보 처리에 결정적 — 사후 정리.

DeepSeek, Mistral은 도쿄 cross-region inference로 fallback.

도쿄 대비 input 3%, output 4% 비쌈. 다만 데이터 전송 비용·VPC endpoint 비용 합치면 한국 내 서비스는 서울이 8% 저렴.

개인정보보호법 국외이전 이슈 회피. 의료·금융 PoC 6개월에 3개 통과. 또 KISA ISMS-P 인증 범위 안.

Cross-region inference 자동 — 서울 quota 초과 시 도쿄로 무음 라우팅, 데이터 거주성 깨질 수 있음. 명시 disable
Guardrails — 한국어 PII 마스킹 v2까지 미진, custom regex로 보강
Provisioned Throughput — 서울은 최소 약정 1시간 단위, 도쿄(분단위)와 다름
Knowledge Base — OpenSearch Serverless 서울 GA가 일부 기능 후행