일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- AWS
- AWS Cloud
- dreamhack
- pandas
- Dreamhack.io
- 클라우드
- Python
- centos7
- error
- wireshark
- 풀이
- 인프런
- mariadb
- nmcli
- 보안뉴스
- 빅데이터분석기사
- pwnable
- ubuntu
- 워게임
- VS Code 오류
- tcache
- Linux
- [EduAtoZ]
- 빅데이터 분석기사
- 빅데이터분석기사 실기
- Cloud
- 빅분기 실기
- 빅데이터 분석기사 실기
- ios frida
- FSB
- Today
- Total
0netw0m1ra
[019] 그룹별 통계값 구하기 본문
1. 그룹별 통계치 구하기
- DataFrame.groupby(컬럼명).적용할통계함수()
DataFrame의 함수 적용 가능 컬럼들에 대해 그룹별 통계치를 구함
통계함수에는 sum, mean, std, var, min, max, count, quantile 등이 있음
- DataFrame.groupby(컬럼명)[컬럼명].적용할통계함수()
특정 컬럼(들)에 대한 결과만 확인할 때
[컬럼명] : 결과가 Series
[[컬럼명]] : 결과가 DataFrame
[[컬럼명1, 컬럼명2, ...]] : 결과 DataFrame
- DataFrame.groupby(컬럼명)[컬럼명].agg([통계함수1, 통계함수2, ....])를 사용함
여러 개의 통계함수를 적용
통계함수를 문자열 형식으로 사용 가능
2. 행, 열에 모두 group을 지정하여 통계값 구하기
- DataFrame.pivot_table(index=행방향컬럼, columns=열방향컬럼, values=집계대상컬럼, aggfunc=구할 통계값)
- 각각에 대해 단독 또는 목록을 사용할 수 있음
- index, columns 는 범주형, values는 연속형 사용
3. Series argmax() argmin()
- Series.argmax() : 가장 값이 큰 것의 integer index 구하기
- Series.argmin() : 가장 값이 작은 것의 integer index 구하기
- Series[Series.argmax()] : 가장 큰 값 구하기
- Series[Series.argmin()] : 가장 작은 값 구하기
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 그룹별 통계값 구하기, 그룹별 통계 심화 학습(groupby, pivot_table)
'빅데이터분석기사 실기' 카테고리의 다른 글
[021] index 번호 정리하기 (0) | 2022.06.20 |
---|---|
[020] 여러 개 파일 합치기 (0) | 2022.06.20 |
[018] DataFrame 구조 조작 (0) | 2022.06.13 |
[017] DataFrame 컬럼/행 추가 및 삭제 (0) | 2022.06.13 |
[016] 컬럼별 함수 적용 - dataframe (0) | 2022.06.13 |