EC2 인스턴스 5대를 운영 중인데 가끔 메모리 부족으로 OOM Killer가 프로세스를 죽입니다. 사후에 dmesg 로그로 확인하는데, 사전에 알림을 받고 싶습니다. 현재는 CloudWatch 기본 메트릭만 보고 있는데, 메모리 사용량은 기본으로 제공 안 되더라고요. 서버 모니터링과 알림 자동화를 어떻게 구성하시나요? 오픈소스로 직접 구축하는 게 좋을지, CloudWatch에 커스텀 메트릭을 보내는 게 좋을지 고민입니다.
댓글 0