핵심 요약
AWS Bedrock 서울 리전(ap-northeast-2) GA 후 사내 7개 LLM 서비스 운영. 지연 도쿄→서울로 -72ms 개선, Claude Opus 4.6/Sonnet 4.5 가용성 99.97%. 한국 개인정보 처리에 결정적 — 사후 정리.
1. 지원 모델
- Anthropic Claude Opus 4.6, Sonnet 4.5, Haiku 4.5
- Amazon Titan Text Premier
- Meta Llama 4 70B
- 임베딩: Titan v2 + Cohere Embed Multilingual
DeepSeek, Mistral은 도쿄 cross-region inference로 fallback.
2. 지연 실측
| 모델 | 도쿄 | 서울 |
|---|---|---|
| Haiku 4.5(500 tok) | 820ms | 748ms |
| Sonnet 4.5(2K tok) | 2.4s | 2.1s |
| Opus 4.6(1K tok) | 3.8s | 3.5s |
| Titan embed(batch 64) | 180ms | 102ms |
3. 비용 — 한국 리전 프리미엄
도쿄 대비 input 3%, output 4% 비쌈. 다만 데이터 전송 비용·VPC endpoint 비용 합치면 한국 내 서비스는 서울이 8% 저렴.
4. 개인정보 처리 — 결정적 이점
개인정보보호법 국외이전 이슈 회피. 의료·금융 PoC 6개월에 3개 통과. 또 KISA ISMS-P 인증 범위 안.
5. 함정
- Cross-region inference 자동 — 서울 quota 초과 시 도쿄로 무음 라우팅, 데이터 거주성 깨질 수 있음. 명시 disable
- Guardrails — 한국어 PII 마스킹 v2까지 미진, custom regex로 보강
- Provisioned Throughput — 서울은 최소 약정 1시간 단위, 도쿄(분단위)와 다름
- Knowledge Base — OpenSearch Serverless 서울 GA가 일부 기능 후행

댓글 0