0netw0m1ra

[003] pandas 구조 본문

빅데이터분석기사 실기

[003] pandas 구조

M1RA 2022. 6. 7. 16:07

- 다양한 형태의 file, 생성자를 사용해 dataframe 만듬

- dataframe, series, index 등의 객체는 ndarray 기반으로 데이터 처리, 분석을 수행함

- 정형/반정형 데이터 <-> pandas <-> 데이터 탐색, 처리, 분석

 

- 데이터 분석

1) 상태 분석 : 데이터의 상태 파악(df.types, df.columns, df.info, df.describe)

2) 필요 데이터 추출 : indexing 사용

3) index 변경, 정렬 : set_index, reset_index, sort_index, sort_value

4) data cleaning : NA value 처리, 이상치 처리, 데이터 변환 등

5) dtype 확인 및 변경 : 필요 dtype 변경

6) 데이터 병합 : pd.concat, pd.merge

7) 통계, 그룹별 통계 : 행/열 별 통계, df.groupby를 사용한 그룹별 통계 처리

8) 피벗테이블 : df.pivot_table을 사용한 행/열/통계 처리

9) 시각화 : 다양한 그래프를 통한 시각화 처리

 

- pands 데이터 구조

1) series : 1차원의 동일 타입 데이터로 구성된 배열

2) dataframe

    2차원 테이블 형식의 배열(하나의 열은 동일 타입 데이터, 서로 다른 열은 다른 타입 데이터 가능)

    raw index(index), columns로 구성됨

    여러 개의 series로 구성된 data table

 

<출처>

인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. Pandas 소개, Series, DataFrame 구조

https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC

 

[EduAtoZ] 빅데이터분석기사 실기 (with Python) - 인프런 | 강의

빅데이터 분석기사 시험은 년 2회 실시되는 국가공인 자격증입니다. 실기를 준비하시는 분을 위해 기초부터 핵심 내용을 상세히 강의하였습니다. 회차를 거듭할수록 시험 난이도는 높아집니다.

www.inflearn.com

 

'빅데이터분석기사 실기' 카테고리의 다른 글

[006] python - enumerate, zip함수  (0) 2022.06.07
[005] python - parameter 종류  (0) 2022.06.07
[004] python - argument 종류  (0) 2022.06.07
[002] python - 랜덤 번호 생성  (0) 2022.06.07
[001] 구글 코랩  (0) 2022.06.07