Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Python
- dreamhack
- pandas
- AWS Cloud
- 빅데이터분석기사 실기
- pwnable
- ios frida
- [EduAtoZ]
- Linux
- 워게임
- FSB
- nmcli
- 빅데이터 분석기사
- 풀이
- error
- AWS
- 빅데이터분석기사
- 보안뉴스
- centos7
- 클라우드
- 빅데이터 분석기사 실기
- wireshark
- Dreamhack.io
- VS Code 오류
- 인프런
- Cloud
- ubuntu
- 빅분기 실기
- mariadb
- tcache
Archives
- Today
- Total
0netw0m1ra
[035] pandas 알아야 하는 것 본문
1. 라이브러리
- numpy API : https://numpy.org/doc/stable/reference/
- pandas API : https://pandas.pydata.org/pandas-docs/stable/reference/index.html
2. 통계 분석 개요
모집단(population) : 연구 대상 데이터 전체 집합
모수(parameter) : 모집단의 특성을 나타내는 수치
표본(sample) : 모집단에서 추출한 일부 데이터
통계량(statistic) : 표본의 특성을 나타내는 수치
모집단의 모수 | 표본의 통계량 |
모평균 | 표본평균 |
모분산 | 표본분산 |
모표준편차 | 표본표준편차 |
3. pandas의 var()와 numpy의 var()가 다른 이유?
# Delta Degrees of Freedom
# pandas) ddof=1 이 기본값임 => 표본이 기준
# numpy) ddof=0 이 기본값임 => 모집단이 기준
4. 표본추출(Sampling)
- DataFrame.sample(n=None, frac=None, ...)
- https://pandas.pydata.org/pandas-docs/dev/reference/api/pandas.DataFrame.sample.html
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. pandas 통계함수의 특징, 샘플링하기
'빅데이터분석기사 실기' 카테고리의 다른 글
[037] 데이터 변환 (0) | 2022.06.21 |
---|---|
[036] 이상치 확인 및 처리 (0) | 2022.06.21 |
[034] DataFrame 실습 (0) | 2022.06.21 |
[033] 조건있는 데이터 추출 실습 (0) | 2022.06.21 |
[032] Series 연산 (0) | 2022.06.21 |