Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 풀이
- pandas
- AWS Cloud
- [EduAtoZ]
- ios frida
- centos7
- 빅데이터 분석기사
- error
- tcache
- FSB
- 인프런
- VS Code 오류
- dreamhack
- Cloud
- Dreamhack.io
- wireshark
- pwnable
- 빅데이터분석기사
- 빅데이터분석기사 실기
- ubuntu
- Linux
- 보안뉴스
- 클라우드
- nmcli
- AWS
- 워게임
- 빅데이터 분석기사 실기
- Python
- 빅분기 실기
- mariadb
Archives
- Today
- Total
0netw0m1ra
[046] sklearn - 데이터 분할(train_test_split) 본문
1. 데이터 분할
- sklearn.model_selecton.train_test_split
- x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size, train_size, random_state, shuffle, stratify)
배열들을 지정된 비율로 나눠서 반환
test_size = 0.25 : 0.0~1.0 테스트 데이터셋 비율
train_size = None : 0.0~1.0 훈련 데이터셋 비율
random_state = None : 정수 값, 난수 발생의 시드(seed) 값
shuffle = True : boolean 값을 전달해서 섞을지 말지 결정(기본값 = True)
stratify : Y의 지정한 데이터 비율을 유지(층화추출), Y가 범주형일 때 사용함
https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html
(실습)
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part3. sklearn 사용법 2/4 - 데이터 분할(train_test_split)
'빅데이터분석기사 실기' 카테고리의 다른 글
[048] Machine Learning - GridSearchCV (0) | 2022.06.22 |
---|---|
[047] Machine Learning Model 실습 - KNeighborsClassfier (0) | 2022.06.22 |
[045] sklearn - import 라이브러리 (0) | 2022.06.22 |
[044] Machine Learning 기본 용어 (0) | 2022.06.22 |
[043] 기울기(회귀계수), 절편 확인, 모델 저장 (0) | 2022.06.22 |