기계학습(머신러닝)시 몇 개의 특징(요인)을 학습 시키는데, 이때의 특징 개수를 필요 이상, 혹은 필요 이하의 개수로 학습시키는 경우 문제가 발생한다.
과대적합 : 필요 이상의 특징을 학습시켜, 유사 한 값에 대해서도 잘못 판단하게 하는 학습
->Train Data 수가 Test Data보다 많은 경우 과대적합(Overfitting)
과소적합 : 필요 이하의 특징을 학습시켜 유사한 모든 값에 대해서 같다고 잘못 판단하게 하는 학습
->Train Data 수가 Test Data보다 적은 경우 과소적합(Underfitting)
일반화 : 훈련 세트로 학습한 모델이 테스트 세트에 대해 정확히 예측하도록 하는 것.
->Train Data, Test Data의 비율은 7:3, 일반화에 해당


댓글
댓글 쓰기