데이터분석-머신러닝-AI/기본학습
fit, fit_transform, transform의 기본 개념 정리
- fit : 데이터에 머신러닝 모델을 맞추는 것
- 학습데이터 세트에서 기반 설정을 하는 함수이다.
- 학습으로 사용되는 데이터와 타겟 데이터를 넣어준다.
- transform : fit을 기준으로 얻은 mean, variance에 맞춰서 변형하는 것
- 실제로 학습시킨 결과를 적용시키는 메서드이다.
- fit_transform : 두 기능을 합쳐 놓은 것
* 왜 train 데이터셋에서만 fot_transform 혹 fit.transform을 하는 것일까?
- test set에도 fit을 하게 되면 기존 학습 데이터에 fit한 기준을 다 무시하고 테스트 데이터에 새로운 mean, variance 값을 얻으면서 결국 테스트 데이터까지 학습해 버리게 된다.
reference :
'데이터분석-머신러닝-AI > 기본학습' 카테고리의 다른 글
통계학 기초 - 표준 정규분포 (1) | 2023.10.20 |
---|
댓글