0netw0m1ra

[019] 그룹별 통계값 구하기 본문

빅데이터분석기사 실기

[019] 그룹별 통계값 구하기

M1RA 2022. 6. 20. 13:03

1. 그룹별 통계치 구하기

- DataFrame.groupby(컬럼명).적용할통계함수()

    DataFrame의 함수 적용 가능 컬럼들에 대해 그룹별 통계치를 구함

    통계함수에는 sum, mean, std, var, min, max, count, quantile 등이 있음

- DataFrame.groupby(컬럼명)[컬럼명].적용할통계함수()

    특정 컬럼(들)에 대한 결과만 확인할 때

    [컬럼명] : 결과가 Series

    [[컬럼명]] : 결과가 DataFrame

    [[컬럼명1, 컬럼명2, ...]] : 결과 DataFrame

- DataFrame.groupby(컬럼명)[컬럼명].agg([통계함수1, 통계함수2, ....])를 사용함

    여러 개의 통계함수를 적용

    통계함수를 문자열 형식으로 사용 가능

2. 행, 열에 모두 group을 지정하여 통계값 구하기

- DataFrame.pivot_table(index=행방향컬럼, columns=열방향컬럼, values=집계대상컬럼, aggfunc=구할 통계값)

- 각각에 대해 단독 또는 목록을 사용할 수 있음

- index, columns 는 범주형, values는 연속형 사용

3. Series argmax() argmin()

- Series.argmax() : 가장 값이 큰 것의 integer index 구하기

- Series.argmin() : 가장 값이 작은 것의 integer index 구하기

- Series[Series.argmax()] : 가장 큰 값 구하기

- Series[Series.argmin()] : 가장 작은 값 구하기

<출처>

인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 그룹별 통계값 구하기, 그룹별 통계 심화 학습(groupby, pivot_table)

https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC