0netw0m1ra

[045] sklearn - import 라이브러리 본문

빅데이터분석기사 실기

[045] sklearn - import 라이브러리

M1RA 2022. 6. 22. 11:54

1. scikit-learn(or sklearn) library 사용

- Machine Learning을 위한 라이브러리

- 활발한 개발 커뮤니티

- 라이브러리의 지속적인 발전

- scikit-learn : https://scikit-learn.org/stable/modules/classes.html

- choosing the right estimator : https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html

 

2. sklearn.preprocessing.StandardScaler

- fit(X_train) : 전처리에 필요한 값 준비, return scaler

- transform(X_train) : 전처리 실행, return 변환된 값

- fit_transform(X_train) : 전처리에 필요한 값 준비 및 처리, return 변환된 값

- 데이터)

    X_train.csv : 학습용 입력 데이터(x_train, x_test) => 동일한 전처리를 해야함

    Y_train.csv : 학습용 출력 데이터(y_train, y_test)

    X_test.csv : 제출용(평가) 입력 데이터(x_submission)

- X_train, X_test 합쳐서 전처리 작업

    전처리 작업 후 분리해서 X_train은 학습모델을 생성, X_test는 제출용 값을 구하는데 사용

    scaler.fit_transform(X_train + X_test)

- X_train, X_test를 각각 전처리 작업

    X_train에 적용된 전처리가 그대로 X_test에 적용되어야 함

    scaler.fit(X_train) : 전처리에 필요한 값 준비

    scaler.transform(X_train) : X_train 전처리 실행

    scaler.transform(X_test) : X_test 전처리 실행

 

<출처>

인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part3. sklearn 사용법 1/4

https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC