[019] 그룹별 통계값 구하기

Notice

Recent Posts

Tags more

Archives

관리 메뉴

0netw0m1ra

빅데이터분석기사 실기

M1RA 2022. 6. 20. 13:03

1. 그룹별 통계치 구하기

- DataFrame.groupby(컬럼명).적용할통계함수()

DataFrame의 함수 적용 가능 컬럼들에 대해 그룹별 통계치를 구함

통계함수에는 sum, mean, std, var, min, max, count, quantile 등이 있음

- DataFrame.groupby(컬럼명)[컬럼명].적용할통계함수()

특정 컬럼(들)에 대한 결과만 확인할 때

[컬럼명] : 결과가 Series

[[컬럼명]] : 결과가 DataFrame

[[컬럼명1, 컬럼명2, ...]] : 결과 DataFrame

- DataFrame.groupby(컬럼명)[컬럼명].agg([통계함수1, 통계함수2, ....])를 사용함

여러 개의 통계함수를 적용

통계함수를 문자열 형식으로 사용 가능

2. 행, 열에 모두 group을 지정하여 통계값 구하기

- DataFrame.pivot_table(index=행방향컬럼, columns=열방향컬럼, values=집계대상컬럼, aggfunc=구할 통계값)

- 각각에 대해 단독 또는 목록을 사용할 수 있음

- index, columns 는 범주형, values는 연속형 사용

3. Series argmax() argmin()

- Series.argmax() : 가장 값이 큰 것의 integer index 구하기

- Series.argmin() : 가장 값이 작은 것의 integer index 구하기

- Series[Series.argmax()] : 가장 큰 값 구하기

- Series[Series.argmin()] : 가장 작은 값 구하기

<출처>

인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 그룹별 통계값 구하기, 그룹별 통계 심화 학습(groupby, pivot_table)

'빅데이터분석기사 실기' Related Articles