일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 클라우드
- AWS Cloud
- 풀이
- pandas
- mariadb
- 워게임
- ubuntu
- 빅분기 실기
- dreamhack
- 빅데이터분석기사 실기
- Python
- wireshark
- centos7
- ios frida
- error
- FSB
- 빅데이터 분석기사 실기
- Cloud
- pwnable
- [EduAtoZ]
- VS Code 오류
- 빅데이터분석기사
- nmcli
- Dreamhack.io
- 보안뉴스
- tcache
- 인프런
- Linux
- 빅데이터 분석기사
- AWS
- Today
- Total
0netw0m1ra
[031] 결측치 확인 및 처리 본문
1. 결측치는 값이 없음을 나타냄
- NaN, NaT, None 등으로 표기되며, NA Value, Missing Value라고 함
2. 결측치 확인
- DataFrame.isna() : 결측치에 대해 True, 아니면 False
- DataFrame.isnull() : DataFrame.isna()와 동일함
- DataFrame.notna() : 결측치가 아닌 것에 대해 True, 결측치면 False
- DataFrame.notnull() : DataFrame.isnull()과 동일함
- Series에도 결측치 확인을 위한 isna() ~ notnull()의 메서드 있음
3. 개수 세기
- DataFrame.isna().sum() : 결측치에 대해 컬럼별 개수
- DataFrame.isna().sum().sum() : 전체 결측치의 개수
4. 결측치 채우기
- DataFrame.fillna(값) : 결측치를 특정 값으로 채움
5. 데이터 타입 변경 방법
- Series.astype(타입)
- 타입 표시 방법 : 'int', 'int32', 'int64', 'float', 'str', 'category', ... 등의 문자열로 지정
- np.int16, np.float32, np.datetime64, ... 등의 numpy 타입으로 지정
- numpy 타입으로 지정하기 위해서는 "import numpy as np"를 먼저 실행하여야 함
6. DataFrame에서 컬럼 제거
- DataFrame.drop(columns=['컬럼명1', '컬럼명2', ...])
- DataFrame.drop('[컬럼명1', '컬럼명2', ...], axis=1)
7. 컬럼이름 변경
- DataFrame.rename(columns=['변경전이름' : '변경후이름', ...])
- DataFrame.rename({'변경전이름':'변경후이름', ...}, axis=1)
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 결측치 확인/채우기, rename으로 컬럼명 변경
'빅데이터분석기사 실기' 카테고리의 다른 글
[033] 조건있는 데이터 추출 실습 (0) | 2022.06.21 |
---|---|
[032] Series 연산 (0) | 2022.06.21 |
[030] str Accessor (0) | 2022.06.21 |
[029] 파생정보 추가 (0) | 2022.06.21 |
[028] value_counts() na 불포함 (0) | 2022.06.21 |