0netw0m1ra

[024] 결측치 제거하기 본문

빅데이터분석기사 실기

[024] 결측치 제거하기

M1RA 2022. 6. 20. 15:11

1. DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

- 결측치 제거에 사용되는 메서드

- how='any' : 결측치가 하나라도 포함된 행 삭제

- how='all' : 모든 데이터가 결측치인 행 삭제

- axis=1 : 컬럼에 대해 동작

- thresh=숫자 : 숫자 이상의 데이터를 가진 행은 삭제 안함

- subset=[컬럼이름1, ...] : subset으로 지정된 컬럼만 사용하여 삭제 대상 검색

2. df.groupby(by=[컬럼1, 컬럼2, ...]).함수()

- 그룹 기준으로 목록을 지정하면 MultiIndex로 만들어짐

- MultiIndex인 경우의 indexing은 tuple을 사용함

- ['년', '월']을 그룹 기준으로 사용한 경우 (2017, 6) 처럼 지정함

 

<출처>

인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 결측치 제거하기

https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC

'빅데이터분석기사 실기' 카테고리의 다른 글

[026] pivot_table  (0) 2022.06.20
[025] 결측치 대체하기  (0) 2022.06.20
[023] 결측치 확인하기  (0) 2022.06.20
[022] 날짜 타입 변경  (0) 2022.06.20
[021] index 번호 정리하기  (0) 2022.06.20