[045] sklearn - import 라이브러리
1. scikit-learn(or sklearn) library 사용
- Machine Learning을 위한 라이브러리
- 활발한 개발 커뮤니티
- 라이브러리의 지속적인 발전
- scikit-learn : https://scikit-learn.org/stable/modules/classes.html
- choosing the right estimator : https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html
2. sklearn.preprocessing.StandardScaler
- fit(X_train) : 전처리에 필요한 값 준비, return scaler
- transform(X_train) : 전처리 실행, return 변환된 값
- fit_transform(X_train) : 전처리에 필요한 값 준비 및 처리, return 변환된 값
- 데이터)
X_train.csv : 학습용 입력 데이터(x_train, x_test) => 동일한 전처리를 해야함
Y_train.csv : 학습용 출력 데이터(y_train, y_test)
X_test.csv : 제출용(평가) 입력 데이터(x_submission)
- X_train, X_test 합쳐서 전처리 작업
전처리 작업 후 분리해서 X_train은 학습모델을 생성, X_test는 제출용 값을 구하는데 사용
scaler.fit_transform(X_train + X_test)
- X_train, X_test를 각각 전처리 작업
X_train에 적용된 전처리가 그대로 X_test에 적용되어야 함
scaler.fit(X_train) : 전처리에 필요한 값 준비
scaler.transform(X_train) : X_train 전처리 실행
scaler.transform(X_test) : X_test 전처리 실행
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part3. sklearn 사용법 1/4