최대 1 분 소요



※ Overfitting (과적합)

  • 지도학습 모델은 학셉 데이터를 분류하고 예측하는 수준으로, 학습에 사용되지 않은 데이터도 정확히 분류하고 예측하리라 기대하며, 이러한 기대가 충족되는 경우 일반화되었다고 함
  • 모델이 너무 복잡해서, 학습 데이터에 대해서만 정확히 분류, 예측하는 모델을 과적합되었다고 하며,
  • 반대로 너무 단순해서 어떠한 데이터에 대해서도 부적합한 모델을 과소적합되었다고 함


■ Overfitting

  • too flexible
  • sample data에 너무 정확하게 적합되어 있어, sample data로 예측을 하면 n개의 data에 accuracy가 거의 100%임. 그러나 새로운 data로 예측을 하면 accuracy가 급격하게 감소됨
  • 과거데이터는 예측을 잘 하나, 미래데이터는 예측을 잘 하지 못함.
  • 특정 데이터에만 잘 맞고 새로운 데이터에는 안맞음

3


□ Overfitting 예시

overfitting

1

  • Training Set에서는 90.5%의 Accuracy, Validation Set에서는 75.5%의 Accuracy
  • Training Set에 overfitting(과적합)되어 있어, Validation Set에서 accuracy가 감소하였다.


better fitting

2

  • Training Set에서는 83%의 Accuracy, Validation Set에서는 78.5%의 Accuracy
  • 첫 번째 예시보다 Training Set에서 accuracy가 감소하였지만, Validation Set에서는 오히려 accuracy가 증가하였다.
  • 새로운 데이터에 대해 더 좋은 예측력을 가지는 모형



※ Underfitting (과소적합)

■ Underfitting

  • not flexible enough
  • 학습이 제대로 되지 않아, Training Data에서의 accuracy가 좋지 않음.


□ Underfitting 예시

4


■ 과적합과 과소적합에 끼치는 주요 인자

  • 모델의 복잡도
  • 샘플 수
  • 차원의 크기 등

tt

∴ Underfitting보다는 Overfitting을 더 조심하자.

댓글남기기