0netw0m1ra

[035] pandas 알아야 하는 것 본문

빅데이터분석기사 실기

[035] pandas 알아야 하는 것

M1RA 2022. 6. 21. 16:44

1. 라이브러리

- numpy API : https://numpy.org/doc/stable/reference/

- pandas API : https://pandas.pydata.org/pandas-docs/stable/reference/index.html

 

2. 통계 분석 개요

모집단(population) : 연구 대상 데이터 전체 집합

모수(parameter) : 모집단의 특성을 나타내는 수치

표본(sample) : 모집단에서 추출한 일부 데이터

통계량(statistic) : 표본의 특성을 나타내는 수치

모집단의 모수 표본의 통계량
모평균 표본평균
모분산 표본분산
모표준편차 표본표준편차

3. pandas의 var()와 numpy의 var()가 다른 이유?

# Delta Degrees of Freedom

# pandas) ddof=1 이 기본값임  => 표본이 기준

# numpy) ddof=0 이 기본값임 => 모집단이 기준

4. 표본추출(Sampling)

- DataFrame.sample(n=None, frac=None, ...)

- https://pandas.pydata.org/pandas-docs/dev/reference/api/pandas.DataFrame.sample.html

 

<출처>

인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. pandas 통계함수의 특징, 샘플링하기

https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC

'빅데이터분석기사 실기' 카테고리의 다른 글

[037] 데이터 변환  (0) 2022.06.21
[036] 이상치 확인 및 처리  (0) 2022.06.21
[034] DataFrame 실습  (0) 2022.06.21
[033] 조건있는 데이터 추출 실습  (0) 2022.06.21
[032] Series 연산  (0) 2022.06.21