저희 서비스가 Claude Sonnet 4.7을 백엔드로 쓰는데, 오늘(5월 10일) 오후 3시쯤부터 갑자기 응답이 엄청 느려졌습니다.
증상:
- P50 latency: 평소 1.2초 → 4.5초
- P95: 평소 3초 → 11초
- P99: 평소 6초 → 22초 (일부 timeout)
- 503/529(overloaded) 응답률 7% (평소 0%)
오늘 오전까지는 멀쩡했어요. 코드 변경도 없습니다. status.anthropic.com에는 "All Systems Operational"이라 나오는데 실제로는 명백히 느립니다.
저희 사용 패턴은 시스템 프롬프트 4K + 사용자 입력 평균 800 토큰, 출력 max_tokens=1500. 모델은 claude-sonnet-4-7. 한국 사용자가 대부분이라 일본 도쿄 리전으로 호출하고 있고요. 다른 분들도 비슷한 현상 겪고 계신가요? 임시 대응 방법이 있을까요?
댓글 0