SWEA_D3_6900_주혁이의 복권 당첨
in Category / Algorithm
in Category / Algorithm
in Category / Algorithm
in Category / STUDY
in Category / Big Data
데이터를 유사도 에 의해서 K개의 그룹으로 나눈 그룹
\sum_{m=1}^k\sum_{t_{mi}\in{Km}}{({C_m}-{t_{mi}})}^2
단점
- 사이즈가 크거나 작을 경우 잘 찾기 못함
- 평균점으로 부터 공모양의 클러스터만 잘 찾음
- 떨어져있는 데이터때문에 평균값이 달라지고 center가 결국 데이터가 없는 부분으로 이동
d_{min}(C_i, C_j) : Single-link
d_{mean}(C_i, C_j)
d_{ave}(C_i, C_j)
d_{max}(C_i, C_j) : Complete-link
in Category / Algorithm