Observability란?
"알 수 없는 상태(unknown unknowns)를 발견할 수 있는 능력"이다. 사전 정의된 메트릭만 보는 모니터링보다 깊다.
3대 Pillar
- Metrics — 수치 집계 (CPU, QPS)
- Logs — 이벤트 텍스트
- Traces — 요청의 전체 경로
추가 개념
- Profiles — 런타임 CPU·메모리 프로파일 (4번째 pillar로 부상)
- Events — 배포·장애 같은 상태 변화 이벤트
Monitoring과 차이
Monitoring = "이미 아는 것을 감시", Observability = "모르는 것까지 파헤칠 수 있는 도구 집합".