Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- AWS Cloud
- 워게임
- 빅데이터 분석기사 실기
- VS Code 오류
- 클라우드
- ios frida
- Cloud
- 인프런
- error
- 보안뉴스
- 빅분기 실기
- 풀이
- mariadb
- Python
- pandas
- AWS
- [EduAtoZ]
- wireshark
- ubuntu
- 빅데이터분석기사
- 빅데이터분석기사 실기
- 빅데이터 분석기사
- nmcli
- Linux
- FSB
- pwnable
- centos7
- Dreamhack.io
- tcache
- dreamhack
Archives
- Today
- Total
0netw0m1ra
[014] Series 통계값 본문
1. 통계값 구하기
- DataFrame.describe() : 적용 가능 컬럼에 대해 count, mean, std, min, max, Q1, Q2, Q3 등의 통계값 구하기
describe()는 수치형 자료에 대해서만 계산해서 보여줌
min, max는 object(string) 형태도 포함해서 계산됨. 따라서, 문자열이 포함되어 정렬됨
문자열 정렬시에는 문자의 코드값을 사용함 -> ord(문자)
- Series.count() : 개수
- Series.sum() : 합계
- Series.mean() : 평균
- Series.std() : 표준편차
- Series.var() : 분산
- Series.median() : 중앙값
- Series.mode() : 최빈값
- Series.quantile() : 분위수
ex. Series.quantile([0.25, 0.5, 0.75])
2. 그룹별 통계치 구하기
- DataFrame.groupby(그룹명).적용할통계함수()
DataFrame.groupby(그룹명)[컬럼].적용할통계함수() : Series 반환
DataFrame.groupby(그룹명)[[컬럼1, 컬럼2, ...]].적용할통계함수() : dataframe 반환
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. Series 통계값 구하기
'빅데이터분석기사 실기' 카테고리의 다른 글
[016] 컬럼별 함수 적용 - dataframe (0) | 2022.06.13 |
---|---|
[015] csv 파일 가져오기, 결측치 확인 및 처리 (0) | 2022.06.13 |
[013] isin(), str Accessor (0) | 2022.06.13 |
[012] 데이터 검색(boolean indexing) (0) | 2022.06.09 |
[011] 데이터 정렬 - top3, top5 (0) | 2022.06.09 |