Overfitting / Underfitting
※ Overfitting (과적합)
- 지도학습 모델은 학셉 데이터를 분류하고 예측하는 수준으로, 학습에 사용되지 않은 데이터도 정확히 분류하고 예측하리라 기대하며, 이러한 기대가 충족되는 경우
일반화
되었다고 함 - 모델이 너무 복잡해서, 학습 데이터에 대해서만 정확히 분류, 예측하는 모델을
과적합
되었다고 하며, - 반대로 너무 단순해서 어떠한 데이터에 대해서도 부적합한 모델을
과소적합
되었다고 함
■ Overfitting
- too flexible
- sample data에 너무 정확하게 적합되어 있어, sample data로 예측을 하면 n개의 data에 accuracy가 거의 100%임. 그러나 새로운 data로 예측을 하면 accuracy가 급격하게 감소됨
- 과거데이터는 예측을 잘 하나, 미래데이터는 예측을 잘 하지 못함.
- 특정 데이터에만 잘 맞고 새로운 데이터에는 안맞음
□ Overfitting 예시
◎ overfitting
- Training Set에서는 90.5%의 Accuracy, Validation Set에서는 75.5%의 Accuracy
- Training Set에 overfitting(과적합)되어 있어, Validation Set에서 accuracy가 감소하였다.
◎ better fitting
- Training Set에서는 83%의 Accuracy, Validation Set에서는 78.5%의 Accuracy
- 첫 번째 예시보다 Training Set에서 accuracy가 감소하였지만, Validation Set에서는 오히려 accuracy가 증가하였다.
- 새로운 데이터에 대해 더 좋은 예측력을 가지는 모형
※ Underfitting (과소적합)
■ Underfitting
- not flexible enough
- 학습이 제대로 되지 않아, Training Data에서의 accuracy가 좋지 않음.
□ Underfitting 예시
■ 과적합과 과소적합에 끼치는 주요 인자
- 모델의 복잡도
- 샘플 수
- 차원의 크기 등
댓글남기기