0netw0m1ra

[037] 데이터 변환 본문

빅데이터분석기사 실기

[037] 데이터 변환

M1RA 2022. 6. 21. 17:31

1. 데이터 변환(Transform)

- 이상치를 완화하거나, 정규분포가 되도록 하기 위해 사용함

- numpy의 log1p, sqrt, expm1, power 등의 함수 사용

    log1p, sqrt 는 큰 값을 작게 만들어 주며, 오른쪽 꼬리가 긴 분포를 정규분포로 변환하는데 사용

    큰 이상치를 작게 만들 수 있음

    expm1, power는 작은 값을 크게 만들어 주며, 왼쪽 꼬리가 긴 분포를 정규분포로 변환하는데 사용함

np.log1p
np.sqrt

2. np.log

3. 변환된 데이터 다시 원본으로 되돌리기

- log1p <-> expm1

- sqrt <-> np.power(?, 2)

 

<출처>

인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 데이터 분포 변환

https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC

'빅데이터분석기사 실기' 카테고리의 다른 글

[039] 데이터 Encoding  (0) 2022.06.21
[038] 데이터 스케이링(Data Scaling)  (0) 2022.06.21
[036] 이상치 확인 및 처리  (0) 2022.06.21
[035] pandas 알아야 하는 것  (0) 2022.06.21
[034] DataFrame 실습  (0) 2022.06.21