0netw0m1ra

[039] 데이터 Encoding 본문

빅데이터분석기사 실기

[039] 데이터 Encoding

M1RA 2022. 6. 21. 18:29

1. Encoding(범주형 - 수치형)

- Label Encoding : 값의 일련번호로 변경, 순서가 있는 경우, 항목이 적을 때

    ex.

    '여성', '남성', '아이' : 0, 1, 2

    '월', '화', '수', '목', '금', ... : 0, 1, 2, 3, ...

    category 타입의 cat.codes

    Series.replace()를 사용함

cat.codes
Series.replace()

 

- One Hot Encoding : 범주의 개수만큼의 feature를 만들어냄, 순서가 없는 경우, 여러 개의 항목일 때

    pd.get_dummies(Series/DataFrame)

pd.get_dummies()

 

<출처>

인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 데이터 Encoding(범주형 - 수치형)

https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC