Association Analysis
※ Association Analysis (연관분석) 데이터에서 항목 간의 연관성을 찾아내는데 사용 “A가 발생하면 B도 발생한다”라는 형태의 규칙, 트랜잭선 데이터를 탐색하는데 사용 ■ 연관 규칙 A: 부모 아이템 집합 (antecedent) B: 자...
※ Association Analysis (연관분석) 데이터에서 항목 간의 연관성을 찾아내는데 사용 “A가 발생하면 B도 발생한다”라는 형태의 규칙, 트랜잭선 데이터를 탐색하는데 사용 ■ 연관 규칙 A: 부모 아이템 집합 (antecedent) B: 자...
※ Covariance (공분산) 두 개의 확률변수 $X$, $Y$가 상호 어떤 관계를 가지며 변화하는가를 나타내주는 척도 두 개의 확률변수 $X$, $Y$의 선형 관계를 나타내는 값 $\mathbb{E}(X-\mu_{X})(Y-\mu_Y)$ 부호는...
※ ANOVA (분산분석) Analysis of Variance 셋 이상의 모집단 간의 평균을 비교하는데 사용 관측한 자료들이 다양하게 나타나는 것을 체계적으로 설명하려는 하나의 통계 기법 → 관측값들이 달라지는 것을 여러 요인으로 나누어 각 요인들이 얼마나 변화에...
※ F-분포 (F-distribution) $\chi^2(u)$, $\chi^2(v)$가 각각 자유도가 $u$, $v$인 독립적인 두 개의 카이제곱 확률 변수라면, \(F(u,v) = \cfrac{\cfrac{\chi^2(u)}{u}}{\cfrac{\chi^2(...
※ Clustering (군집화) Unsupervised learning (비지도 학습) Unsupervised Classification 유사한 개체들의 집단을 판별하는 방법론 데이터의 특징만으로 서로 유사한 특징을 가진 데이터들끼리 그룹화함으로써 cluster(...