AWS Bedrock 한국 리전(ap-northeast-2)에 Claude 4.9 어제 GA. 기본 quota가 100 RPM(분당 요청 100건)인데 저희 production 트래픽이 1,200 RPM입니다.
AWS Support에 quota 증가 요청했는데:
"Bedrock Anthropic 모델 quota 증가는 14~28일 영업일 소요"
2주~한 달 기다려야 합니다. 그동안 도쿄 리전 사용하면 데이터 거주성 깨지고, OpenAI/Vertex로 일부 fallback 하면 통합 비용 증가.
빠르게 quota 받은 분 있으신가요?
댓글 0