빅데이터분석기사 실기
[038] 데이터 스케이링(Data Scaling)
M1RA
2022. 6. 21. 18:06
1. 데이터 스케일링
- min-max normalization : 값의 범위를 [0, 1]로 변환
(xi - x.min()) / (x.max() - x.min())
- standardization : 특성의 값이 표준정규분포를 갖도록 변환(평균 0, 표준편차 1)
(xi - x.mean()) / x.std()
- sklearn의 MinMaxScaler, StandardScaler 사용 가능
스케일러의 fit_transform() 사용시 2차원의 데이터를 전달해야 함
(DataFrame도 2차원), 결과는 ndarray로 반환 됨
- scipy.stat의 zxcore 함수 사용 가능
1차원 데이터 가능
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 데이터 스케일링