본문 바로가기

머신러닝/알고리즘

5-2. k-means (k-평균 알고리즘)

k-평균 알고리즘(K-means algorithm)

 

주어진 데이터를 k개의 클러스터로 묶는 알고리즘

비지도 학습 (자율 학습)

 

알고리즘 실행 과정

1) 초기 k "평균값" (위의 경우 k=3) 은 데이터 오브젝트 중에서 무작위로 뽑힌다. (색칠된 동그라미로 표시됨) 2) k 각 데이터 오브젝트들은 가장 가까이 있는 평균값을 기준으로 묶인다. 평균값을 기준으로 분할된 영역은 보로노이 다이어그램 으로 표시된다
3) k개의 클러스터의 중심점을 기준으로 평균값이 재조정된다 4) 수렴할 때까지 2), 3) 과정을 반복한다

 

동작 과정

https://commons.wikimedia.org/wiki/File:Kmeans_animation_withoutWatermark.gif#/media/파일:Kmeans_animation_withoutWatermark.gif 이미지 참조

 

k 가 작을 때

https://commons.wikimedia.org/wiki/File:Kmeans_wrongK.PNG#/media/파일:Kmeans_wrongK.PNG 이미지 참조

 

k가 클 때

https://commons.wikimedia.org/wiki/File:Kmeans_toomany.PNG#/media/파일:Kmeans_toomany.PNG 이미지 참조

 

참조 : ko.wikipedia.org/wiki/K-%ED%8F%89%EA%B7%A0_%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98
 

k-평균 알고리즘 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. k-평균 알고리즘(K-means algorithm)은 주어진 데이터를 k개의 클러스터로 묶는 알고리즘으로, 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작한다. 이

ko.wikipedia.org

 

'머신러닝 > 알고리즘' 카테고리의 다른 글

5-3. Apriori (연관규칙)  (0) 2020.09.12
5-2-1. k-means 실습  (0) 2020.09.12
5-1-1. SVM 실습  (0) 2020.09.12
5-1. SVM (Support Vector Machine)  (0) 2020.09.12
4-1-2. 타이타닉 생존자 예측 - 의사결정나무 정확도  (0) 2020.09.11