핵심 요약
KT 클라우드 천안 데이터센터에서 5월 8일 새벽 3시 17분부터 오전 10시 24분까지 약 7시간 대규모 장애가 발생했다. 한국 IDC 사상 두 번째로 긴 단일 사업자 장애로, 영향 받은 기업은 KT 자체 집계 기준 320곳, 영향 사용자 추정 1,800만 명이다.
- 발생 시각: 2026-05-08 03:17 KST
- 복구 시각: 2026-05-08 10:24 KST (7시간 7분)
- 원인 (잠정): 전력 분전반 화재 + UPS 자동 전환 실패
- 영향 서비스: 천안 리전 사용 인스턴스 전체
장애 타임라인
| 시각 | 이벤트 |
|---|---|
| 03:17 | 분전반 #B4 화재 감지, 자동 전원 차단 |
| 03:19 | UPS 자동 전환 — 30% 부하 실패 (사유: 캐패시터 노후) |
| 03:25 | 천안 리전 인스턴스 60% 다운, 모니터링 알람 폭주 |
| 04:00 | KT 사고대응 1차 발표 — "수 시간 내 복구" |
| 05:30 | 2차 화재 감지 — 분전반 #B5로 확산 |
| 07:00 | 판교 리전으로 일부 워크로드 페일오버 (수동) |
| 09:50 | 화재 진압 완료, 전원 재공급 |
| 10:24 | 주요 서비스 99% 복구 |
주요 피해 기업
- 스타트업: 헬스케어·푸드테크·교육 등 320곳 — 일평균 매출 13~30% 감소
- 공공: 광역시 1곳 민원 시스템, 교육청 4곳 학사 시스템 — 평일이라 불만 폭주
- 금융: 일부 핀테크 결제 인프라 일시 중단 (대형 은행은 영향 없음 — 다중 리전 구성)
- 이커머스: 중견 쇼핑몰 17곳 — 오전 트래픽 시간대 직격
KT 입장
KT 클라우드 윤동식 대표는 오전 10시 30분 긴급 기자회견을 열고 "고객 영향에 깊이 사과드린다"며 다음을 발표했다.
- SLA 위반 보상: 약정 SLA(99.95%) 위반분 자동 크레딧 (영향 시간 × 평균 단가의 1,000%)
- 추가 보상: 영향 기업 일괄 1개월 사용료 면제 (별도 신청 불요)
- 긴급 점검: 전국 6개 데이터센터 분전반·UPS 전수 검사 — 6월 말까지
- 사고 보고서: 5월 22일 공개 예정
업계 반응
한 중견 스타트업 CTO는 "단일 리전에 다 올린 우리가 잘못이지만, IDC 화재가 한 분기 만에 두 번째다"라며 분노를 표했다(2026년 1월에도 다른 IDC에서 소규모 장애 발생). 반면 AWS·Azure·NHN 클라우드는 자사 마이그레이션 프로모션을 일제히 띄웠다.
전문가 코멘트
박종승 KISA 책임연구원은 "이번 사고는 분전반 단일 장애가 UPS·페일오버까지 줄줄이 무너진 전형적 도미노형 장애"라며 "BCP(업무연속성계획)에서 '클라우드 사업자 단일 의존'을 리스크로 인식해야 할 때"라고 지적했다.
장기 영향
- 중기 클라우드 시장에서 멀티 리전·멀티 클라우드 도입 가속 전망
- KT 클라우드 신규 수주 단기 위축 불가피
- 국가 정보화 사업의 KT 의존도 재검토 목소리 — 정부 입찰 평가 기준에 'BCP 다양성' 추가 검토 중

댓글 0