빅데이터분석기사 실기
[029] 파생정보 추가
M1RA
2022. 6. 21. 13:34
1. Series의 str Accessor 사용
- 세부 내용 : https://pandas.pydata.org/docs/reference/series.html#string-handling
- Series.str.split() : whitespace(공백, 탭 등)을 기준으로 문자열 분리
ex. '서울특별시 종로구 ...' => [서울특별시, 종로구, ...]
- Series.str[0] : Series가 여러 개의 요소가 있는 경우 그 첫 번째 요소
2. Series.uniques() : 중복 데이터의 제거 후 배열로 반환, NA value가 있다면 포함
3. Boolean Indexing 사용하여 조건에 맞는 데이터 가져오기
- DataFrame.loc[조건, :]
- DataFrame[조건]
- 조건은 boolean dtype이어야 하며 행의 수와 같아야 함
- 복잡한 조건 작성
(조건1) | (조건2) : 조건1 또는 조건2를 만족하는 데이터
(조건1) & (조건2) : 조건1, 조건2 모두 만족하는 데이터
~(조건) : 조건이 거짓인 데이터
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 문자열 분리(split)-주소 분리하기