Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 빅데이터분석기사
- mariadb
- 클라우드
- Python
- 빅데이터 분석기사
- VS Code 오류
- Dreamhack.io
- [EduAtoZ]
- 빅분기 실기
- pwnable
- 워게임
- ios frida
- dreamhack
- pandas
- 보안뉴스
- 인프런
- 빅데이터 분석기사 실기
- error
- ubuntu
- wireshark
- 빅데이터분석기사 실기
- nmcli
- AWS
- FSB
- 풀이
- AWS Cloud
- tcache
- Linux
- Cloud
- centos7
Archives
- Today
- Total
0netw0m1ra
[037] 데이터 변환 본문
1. 데이터 변환(Transform)
- 이상치를 완화하거나, 정규분포가 되도록 하기 위해 사용함
- numpy의 log1p, sqrt, expm1, power 등의 함수 사용
log1p, sqrt 는 큰 값을 작게 만들어 주며, 오른쪽 꼬리가 긴 분포를 정규분포로 변환하는데 사용
큰 이상치를 작게 만들 수 있음
expm1, power는 작은 값을 크게 만들어 주며, 왼쪽 꼬리가 긴 분포를 정규분포로 변환하는데 사용함
2. np.log
3. 변환된 데이터 다시 원본으로 되돌리기
- log1p <-> expm1
- sqrt <-> np.power(?, 2)
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 데이터 분포 변환
'빅데이터분석기사 실기' 카테고리의 다른 글
[039] 데이터 Encoding (0) | 2022.06.21 |
---|---|
[038] 데이터 스케이링(Data Scaling) (0) | 2022.06.21 |
[036] 이상치 확인 및 처리 (0) | 2022.06.21 |
[035] pandas 알아야 하는 것 (0) | 2022.06.21 |
[034] DataFrame 실습 (0) | 2022.06.21 |