일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 인프런
- 클라우드
- dreamhack
- mariadb
- error
- 풀이
- 빅데이터분석기사
- nmcli
- centos7
- pwnable
- Linux
- [EduAtoZ]
- 빅데이터 분석기사 실기
- AWS
- Dreamhack.io
- 워게임
- Python
- Cloud
- wireshark
- AWS Cloud
- 빅데이터 분석기사
- FSB
- ubuntu
- ios frida
- VS Code 오류
- 빅데이터분석기사 실기
- 빅분기 실기
- 보안뉴스
- tcache
- pandas
- Today
- Total
0netw0m1ra
[003] pandas 구조 본문
- 다양한 형태의 file, 생성자를 사용해 dataframe 만듬
- dataframe, series, index 등의 객체는 ndarray 기반으로 데이터 처리, 분석을 수행함
- 정형/반정형 데이터 <-> pandas <-> 데이터 탐색, 처리, 분석
- 데이터 분석
1) 상태 분석 : 데이터의 상태 파악(df.types, df.columns, df.info, df.describe)
2) 필요 데이터 추출 : indexing 사용
3) index 변경, 정렬 : set_index, reset_index, sort_index, sort_value
4) data cleaning : NA value 처리, 이상치 처리, 데이터 변환 등
5) dtype 확인 및 변경 : 필요 dtype 변경
6) 데이터 병합 : pd.concat, pd.merge
7) 통계, 그룹별 통계 : 행/열 별 통계, df.groupby를 사용한 그룹별 통계 처리
8) 피벗테이블 : df.pivot_table을 사용한 행/열/통계 처리
9) 시각화 : 다양한 그래프를 통한 시각화 처리
- pands 데이터 구조
1) series : 1차원의 동일 타입 데이터로 구성된 배열
2) dataframe
2차원 테이블 형식의 배열(하나의 열은 동일 타입 데이터, 서로 다른 열은 다른 타입 데이터 가능)
raw index(index), columns로 구성됨
여러 개의 series로 구성된 data table
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. Pandas 소개, Series, DataFrame 구조
'빅데이터분석기사 실기' 카테고리의 다른 글
[006] python - enumerate, zip함수 (0) | 2022.06.07 |
---|---|
[005] python - parameter 종류 (0) | 2022.06.07 |
[004] python - argument 종류 (0) | 2022.06.07 |
[002] python - 랜덤 번호 생성 (0) | 2022.06.07 |
[001] 구글 코랩 (0) | 2022.06.07 |