Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 인프런
- VS Code 오류
- ubuntu
- 빅데이터분석기사 실기
- mariadb
- Cloud
- AWS
- 빅분기 실기
- pandas
- 빅데이터 분석기사
- 빅데이터 분석기사 실기
- error
- pwnable
- 보안뉴스
- Python
- AWS Cloud
- dreamhack
- 빅데이터분석기사
- ios frida
- wireshark
- Dreamhack.io
- centos7
- 워게임
- tcache
- Linux
- FSB
- 클라우드
- nmcli
- 풀이
- [EduAtoZ]
Archives
- Today
- Total
0netw0m1ra
[039] 데이터 Encoding 본문
1. Encoding(범주형 - 수치형)
- Label Encoding : 값의 일련번호로 변경, 순서가 있는 경우, 항목이 적을 때
ex.
'여성', '남성', '아이' : 0, 1, 2
'월', '화', '수', '목', '금', ... : 0, 1, 2, 3, ...
category 타입의 cat.codes
Series.replace()를 사용함
- One Hot Encoding : 범주의 개수만큼의 feature를 만들어냄, 순서가 없는 경우, 여러 개의 항목일 때
pd.get_dummies(Series/DataFrame)
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 데이터 Encoding(범주형 - 수치형)
'빅데이터분석기사 실기' 카테고리의 다른 글
[043] 기울기(회귀계수), 절편 확인, 모델 저장 (0) | 2022.06.22 |
---|---|
[040] 데이터 Binning(수치형 - 범주형) (0) | 2022.06.21 |
[038] 데이터 스케이링(Data Scaling) (0) | 2022.06.21 |
[037] 데이터 변환 (0) | 2022.06.21 |
[036] 이상치 확인 및 처리 (0) | 2022.06.21 |