0netw0m1ra

[038] 데이터 스케이링(Data Scaling) 본문

빅데이터분석기사 실기

[038] 데이터 스케이링(Data Scaling)

M1RA 2022. 6. 21. 18:06

1. 데이터 스케일링

- min-max normalization : 값의 범위를 [0, 1]로 변환

    (xi - x.min()) / (x.max() - x.min())

- standardization : 특성의 값이 표준정규분포를 갖도록 변환(평균 0, 표준편차 1)

    (xi - x.mean()) / x.std()

- sklearn의 MinMaxScaler, StandardScaler 사용 가능

    스케일러의 fit_transform() 사용시 2차원의 데이터를 전달해야 함

    (DataFrame도 2차원), 결과는 ndarray로 반환 됨

- scipy.stat의 zxcore 함수 사용 가능

    1차원 데이터 가능

 

<출처>

인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 데이터 스케일링

https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC

'빅데이터분석기사 실기' 카테고리의 다른 글

[040] 데이터 Binning(수치형 - 범주형)  (0) 2022.06.21
[039] 데이터 Encoding  (0) 2022.06.21
[037] 데이터 변환  (0) 2022.06.21
[036] 이상치 확인 및 처리  (0) 2022.06.21
[035] pandas 알아야 하는 것  (0) 2022.06.21