0netw0m1ra

[014] Series 통계값 본문

빅데이터분석기사 실기

[014] Series 통계값

M1RA 2022. 6. 13. 12:26

1. 통계값 구하기

- DataFrame.describe() : 적용 가능 컬럼에 대해 count, mean, std, min, max, Q1, Q2, Q3 등의 통계값 구하기

    describe()는 수치형 자료에 대해서만 계산해서 보여줌

    min, max는 object(string) 형태도 포함해서 계산됨. 따라서, 문자열이 포함되어 정렬됨

    문자열 정렬시에는 문자의 코드값을 사용함 -> ord(문자)

- Series.count() : 개수

- Series.sum() : 합계

- Series.mean() : 평균

- Series.std() : 표준편차

- Series.var() : 분산

- Series.median() : 중앙값

- Series.mode() : 최빈값

- Series.quantile() : 분위수

ex. Series.quantile([0.25, 0.5, 0.75])

2. 그룹별 통계치 구하기

- DataFrame.groupby(그룹명).적용할통계함수()

    DataFrame.groupby(그룹명)[컬럼].적용할통계함수() : Series 반환

    DataFrame.groupby(그룹명)[[컬럼1, 컬럼2, ...]].적용할통계함수() : dataframe 반환

 

<출처>

인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. Series 통계값 구하기

https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC