0netw0m1ra

[029] 파생정보 추가 본문

빅데이터분석기사 실기

[029] 파생정보 추가

M1RA 2022. 6. 21. 13:34

1. Series의 str Accessor 사용

- 세부 내용 : https://pandas.pydata.org/docs/reference/series.html#string-handling

- Series.str.split() : whitespace(공백, 탭 등)을 기준으로 문자열 분리

    ex. '서울특별시 종로구 ...' => [서울특별시, 종로구, ...]

- Series.str[0] : Series가 여러 개의 요소가 있는 경우 그 첫 번째 요소

2. Series.uniques() : 중복 데이터의 제거 후 배열로 반환, NA value가 있다면 포함

3. Boolean Indexing 사용하여 조건에 맞는 데이터 가져오기

- DataFrame.loc[조건, :]

- DataFrame[조건]

- 조건은 boolean dtype이어야 하며 행의 수와 같아야 함

- 복잡한 조건 작성

    (조건1) | (조건2) : 조건1 또는 조건2를 만족하는 데이터

    (조건1) & (조건2) : 조건1, 조건2 모두 만족하는 데이터

    ~(조건) : 조건이 거짓인 데이터

 

<출처>

인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 문자열 분리(split)-주소 분리하기

https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC