일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 워게임
- 빅데이터분석기사
- tcache
- pwnable
- ubuntu
- AWS Cloud
- dreamhack
- mariadb
- 빅분기 실기
- 빅데이터 분석기사
- pandas
- FSB
- 빅데이터분석기사 실기
- nmcli
- VS Code 오류
- 인프런
- Linux
- 클라우드
- [EduAtoZ]
- wireshark
- ios frida
- centos7
- 빅데이터 분석기사 실기
- error
- Cloud
- 풀이
- Dreamhack.io
- Python
- 보안뉴스
- AWS
- Today
- Total
0netw0m1ra
[045] sklearn - import 라이브러리 본문
1. scikit-learn(or sklearn) library 사용
- Machine Learning을 위한 라이브러리
- 활발한 개발 커뮤니티
- 라이브러리의 지속적인 발전
- scikit-learn : https://scikit-learn.org/stable/modules/classes.html
- choosing the right estimator : https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html
2. sklearn.preprocessing.StandardScaler
- fit(X_train) : 전처리에 필요한 값 준비, return scaler
- transform(X_train) : 전처리 실행, return 변환된 값
- fit_transform(X_train) : 전처리에 필요한 값 준비 및 처리, return 변환된 값
- 데이터)
X_train.csv : 학습용 입력 데이터(x_train, x_test) => 동일한 전처리를 해야함
Y_train.csv : 학습용 출력 데이터(y_train, y_test)
X_test.csv : 제출용(평가) 입력 데이터(x_submission)
- X_train, X_test 합쳐서 전처리 작업
전처리 작업 후 분리해서 X_train은 학습모델을 생성, X_test는 제출용 값을 구하는데 사용
scaler.fit_transform(X_train + X_test)
- X_train, X_test를 각각 전처리 작업
X_train에 적용된 전처리가 그대로 X_test에 적용되어야 함
scaler.fit(X_train) : 전처리에 필요한 값 준비
scaler.transform(X_train) : X_train 전처리 실행
scaler.transform(X_test) : X_test 전처리 실행
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part3. sklearn 사용법 1/4
'빅데이터분석기사 실기' 카테고리의 다른 글
[047] Machine Learning Model 실습 - KNeighborsClassfier (0) | 2022.06.22 |
---|---|
[046] sklearn - 데이터 분할(train_test_split) (0) | 2022.06.22 |
[044] Machine Learning 기본 용어 (0) | 2022.06.22 |
[043] 기울기(회귀계수), 절편 확인, 모델 저장 (0) | 2022.06.22 |
[040] 데이터 Binning(수치형 - 범주형) (0) | 2022.06.21 |