K-means란?
데이터를 K개 그룹으로 나누는 비지도 학습의 고전이다.
알고리즘
- K개 중심점 무작위 배치
- 각 점을 가장 가까운 중심에 할당
- 중심점을 해당 그룹 평균으로 이동
- 수렴할 때까지 반복
한계
K를 미리 정해야 함, 구형 클러스터만 잘 찾음 → DBSCAN, HDBSCAN 대안.
K개 클러스터 중심을 반복 갱신하는 대표적 클러스터링 알고리즘.
데이터를 K개 그룹으로 나누는 비지도 학습의 고전이다.
K를 미리 정해야 함, 구형 클러스터만 잘 찾음 → DBSCAN, HDBSCAN 대안.