K-Means Clustering in Excel
※ K-Means Clustering in Excel
Example Data
- 구매정보 Data
- 고객정보 Data
■ 데이터전처리
1. 구매정보 Data를 피벗테이블로 만들기
2. 구매정보와 고객정보 병합
3. 필요없는 데이터 제거
- 잡화변수: 데이터가 몇개 없어서 제거
- 성별변수: 사용하지 않을 변수라 제거
- ID - 10002416: 고객정보가 없어서 제거 등
4. 표준화
- 표준화를 위해 각 변수의 평균, 표준편차 구하기
=average(data)
=stdev.s(data)
- 엑셀수식
- 표준화
=(data-average)/stdev.s
- 엑셀수식
5. K개수와 중심점 정하기
- 임의의 K 정하기. (k=4)
- 임의의 중심점 정하기 (각 1, 2, 3, 4번째 변수)
# vlookpu 함수 이용
=vlookup(...)
- 엑셀수식
6. K-Means Clustering 시행
- 각 data가 중심으로부터 얼마나 떨어져있는지 계산 (유클리디안 거리)
# 거리를 구하기 위해
=sumxmy2(...)
# 어느 중심점이 가까운지 구하기 위해
=min(...)
# 어느 군집으로 할당할건지 정하기 위해
=match(...)
- 엑셀수식
7. 각 데이터들의 최소거리의 합
=sum(data)
- 엑셀수식
8. 중심점을 바꿔가며 반복
-
해찾기 도구
-
해찾기 매개변수 입력
- 목표 설정: 각 데이터들의 최소거리의 합
- 대상: 최소
- 변수 셀 변경: 중심점들의 셀
- 제한 조건
- EX) 중심점: 정수, 중심점의 범위 등
- 옵션: 최대 시간, 반복횟수 설정 등
9. 해찾기 결과
- 해 찾기 해 보존
댓글남기기