0netw0m1ra

[031] 결측치 확인 및 처리 본문

빅데이터분석기사 실기

[031] 결측치 확인 및 처리

M1RA 2022. 6. 21. 14:14

1. 결측치는 값이 없음을 나타냄

- NaN, NaT, None 등으로 표기되며, NA Value, Missing Value라고 함

2. 결측치 확인

- DataFrame.isna() : 결측치에 대해 True, 아니면 False

- DataFrame.isnull() : DataFrame.isna()와 동일함

- DataFrame.notna() : 결측치가 아닌 것에 대해 True, 결측치면 False

- DataFrame.notnull() : DataFrame.isnull()과 동일함

- Series에도 결측치 확인을 위한 isna() ~ notnull()의 메서드 있음

3. 개수 세기

- DataFrame.isna().sum() : 결측치에 대해 컬럼별 개수

- DataFrame.isna().sum().sum() : 전체 결측치의 개수

4. 결측치 채우기

- DataFrame.fillna(값) : 결측치를 특정 값으로 채움

 

5. 데이터 타입 변경 방법

- Series.astype(타입)

- 타입 표시 방법 : 'int', 'int32', 'int64', 'float', 'str', 'category', ... 등의 문자열로 지정

- np.int16, np.float32, np.datetime64, ... 등의 numpy 타입으로 지정

- numpy 타입으로 지정하기 위해서는 "import numpy as np"를 먼저 실행하여야 함

 

6. DataFrame에서 컬럼 제거

- DataFrame.drop(columns=['컬럼명1', '컬럼명2', ...])

- DataFrame.drop('[컬럼명1', '컬럼명2', ...], axis=1)

7. 컬럼이름 변경

- DataFrame.rename(columns=['변경전이름' : '변경후이름', ...])

- DataFrame.rename({'변경전이름':'변경후이름', ...}, axis=1)

 

<출처>

인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 결측치 확인/채우기, rename으로 컬럼명 변경

https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC

'빅데이터분석기사 실기' 카테고리의 다른 글

[033] 조건있는 데이터 추출 실습  (0) 2022.06.21
[032] Series 연산  (0) 2022.06.21
[030] str Accessor  (0) 2022.06.21
[029] 파생정보 추가  (0) 2022.06.21
[028] value_counts() na 불포함  (0) 2022.06.21