[머신러닝] 일반화/과대적합/과소적합

기계학습(머신러닝)시 몇 개의 특징(요인)을 학습 시키는데, 이때의 특징 개수를 필요 이상, 혹은 필요 이하의 개수로 학습시키는 경우 문제가 발생한다.




과대적합 : 필요 이상의 특징을 학습시켜, 유사 한 값에 대해서도 잘못 판단하게 하는 학습

->Train Data 수가 Test Data보다 많은 경우 과대적합(Overfitting)


과소적합 : 필요 이하의 특징을 학습시켜 유사한 모든 값에 대해서 같다고 잘못 판단하게 하는 학습

->Train Data 수가 Test Data보다 적은 경우 과소적합(Underfitting)


일반화 : 훈련 세트로 학습한 모델이 테스트 세트에 대해 정확히 예측하도록 하는 것.

->Train Data, Test Data의 비율은 7:3, 일반화에 해당


적절한 수, 다양한 유형의 훈련 데이터를 학습 함으로써, Test Data에 대한 정확도가 최대인 지점인 모델을 차용할 필요가 있다.


댓글