최대 1 분 소요



※ K-Means Clustering in Excel

Example Data

  • 구매정보 Data 구매정보


  • 고객정보 Data 고객정보



■ 데이터전처리

1. 구매정보 Data를 피벗테이블로 만들기

피벗테이블


2. 구매정보와 고객정보 병합

병합


3. 필요없는 데이터 제거

  • 잡화변수: 데이터가 몇개 없어서 제거
  • 성별변수: 사용하지 않을 변수라 제거
  • ID - 10002416: 고객정보가 없어서 제거 등

병합


4. 표준화

  1. 표준화를 위해 각 변수의 평균, 표준편차 구하기
=average(data)
=stdev.s(data)

표준화준비

  • 엑셀수식

표준화수식


  1. 표준화
=(data-average)/stdev.s

표준화

  • 엑셀수식

표준화수식


5. K개수와 중심점 정하기

  1. 임의의 K 정하기. (k=4)
  2. 임의의 중심점 정하기 (각 1, 2, 3, 4번째 변수)
# vlookpu 함수 이용
=vlookup(...)

중심점

  • 엑셀수식

중심점수식


6. K-Means Clustering 시행

  1. 각 data가 중심으로부터 얼마나 떨어져있는지 계산 (유클리디안 거리)
# 거리를 구하기 위해
=sumxmy2(...)
# 어느 중심점이 가까운지 구하기 위해
=min(...)
# 어느 군집으로 할당할건지 정하기 위해
=match(...)

군집화

  • 엑셀수식

군집화수식

7. 각 데이터들의 최소거리의 합

=sum(data)

최소거리

  • 엑셀수식

최소거리수식


8. 중심점을 바꿔가며 반복

  1. 해찾기 도구 해찾기

  2. 해찾기 매개변수 입력

    • 목표 설정: 각 데이터들의 최소거리의 합
    • 대상: 최소
    • 변수 셀 변경: 중심점들의 셀
    • 제한 조건
      • EX) 중심점: 정수, 중심점의 범위 등
    • 옵션: 최대 시간, 반복횟수 설정 등

해찾기도구

해찾기도구

해찾기도구


9. 해찾기 결과

  • 해 찾기 해 보존

해찾기결과


해찾기결과

댓글남기기