최근 포스트

Tidy data vs. Untidy data

1 분 소요

※ Tidy Data = Long Format Data(Table) 데이터 전처리에 걸리는 시간을 최소하하기 위한 표준화된 데이터 형태 데이터를 행 방향으로 구성하는 형식으로, 각 행은 하나의 데이터 관찰값을 나타냄 필요 조건 Each var...

Neural Network

3 분 소요

※ Neural Network 데이터로부터 반복적인 학습과정을 거쳐 데이터에 숨어있는 패턴이나 연관관계를 찾아냄 Usage Pattern Recognition Classification Clustering Associative Memory Data Comp...

Model Assessment (모형평가)

5 분 소요

※ Model Assessment란? 예측을 위해 만든 모형이 random model보다 과연 우수한지, 서로 다른 모형들 중 어느 것이 가장 우수한 예측력을 가지는지 비교, 분석하는 과정 Evaluating classification models (분류모델 평가) ...

Regression

2 분 소요

※ Regression 주어진 데이터(X)와 찾고자 하는 값(y) 사이의 관계를 찾는 방법 주어진 input data와 관심 있는 target value 사이의 관계를 모델링하는 것 input data는 일반적으로 벡터(feature vector), target val...

Decision Tree and Random Forest

5 분 소요

※ Decision Tree (의사결정 나무) source: https://scikit-learn.org/stable/auto_examples/tree/plot_iris_dtc.html ■ Tree Model (나무 모형) 발견된 변수의 규칙 혹은 조건문을 토대로 나무...