
엘보우 분석 & 실루엣 분석
·
Data & AI/Data Analysis
K-means 최적의 값 탐색K-means 알고리즘을 사용할 때 가장 중요한 문제 중 하나는 적절한 k 값을 선택하는 것이다. 1. 엘보우 분석엘보우 분석 방법은 K-means 알고리즘을 실행할 때, 클러스터 개수 (k)를 점차 증가시키면서 클러스터링을 수행하고, 이에 따른 SSE(Sum of Squared Error)값을 계산하여 그래프로 나타내어 최적의 값을 선택하는 방법이다. SSE는 각 데이터 포인트와 해당 클러스터 중심점 사이의 거리를 제곱한 값의 합을 의마한다. SSE 값이 작을수록 클러스터링의 성능이 좋다고 판단할 수 있다. 그래서 엘보우 분석에서는 클러스터 개수(K)를 증가시키면서 SSE 값을 계싼하고, 이를 그래프로 나타낸다. 이때 SSE 값이 감소하는 정도가 급격하게 줄어드는 지점을 ..