[046] sklearn - 데이터 분할(train_test

Notice

Recent Posts

Tags more

Archives

관리 메뉴

0netw0m1ra

빅데이터분석기사 실기

M1RA 2022. 6. 22. 12:18

1. 데이터 분할

- sklearn.model_selecton.train_test_split

- x_train, x_test, y_train, y_test = train_test_split(X, Y, test_size, train_size, random_state, shuffle, stratify)

배열들을 지정된 비율로 나눠서 반환

test_size = 0.25 : 0.0~1.0 테스트 데이터셋 비율

train_size = None : 0.0~1.0 훈련 데이터셋 비율

random_state = None : 정수 값, 난수 발생의 시드(seed) 값

shuffle = True : boolean 값을 전달해서 섞을지 말지 결정(기본값 = True)

stratify : Y의 지정한 데이터 비율을 유지(층화추출), Y가 범주형일 때 사용함

(실습)

<출처>

인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part3. sklearn 사용법 2/4 - 데이터 분할(train_test_split)

[048] Machine Learning - GridSearchCV (0)	2022.06.22
[047] Machine Learning Model 실습 - KNeighborsClassfier (0)	2022.06.22
[045] sklearn - import 라이브러리 (0)	2022.06.22
[044] Machine Learning 기본 용어 (0)	2022.06.22
[043] 기울기(회귀계수), 절편 확인, 모델 저장 (0)	2022.06.22

'빅데이터분석기사 실기' Related Articles