빅데이터분석기사 실기
[039] 데이터 Encoding
M1RA
2022. 6. 21. 18:29
1. Encoding(범주형 - 수치형)
- Label Encoding : 값의 일련번호로 변경, 순서가 있는 경우, 항목이 적을 때
ex.
'여성', '남성', '아이' : 0, 1, 2
'월', '화', '수', '목', '금', ... : 0, 1, 2, 3, ...
category 타입의 cat.codes
Series.replace()를 사용함
- One Hot Encoding : 범주의 개수만큼의 feature를 만들어냄, 순서가 없는 경우, 여러 개의 항목일 때
pd.get_dummies(Series/DataFrame)
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 데이터 Encoding(범주형 - 수치형)