'빅데이터 분석기사' 태그의 글 목록 (2 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록빅데이터 분석기사 (19)

0netw0m1ra

[035] pandas 알아야 하는 것

1. 라이브러리 - numpy API : https://numpy.org/doc/stable/reference/ - pandas API : https://pandas.pydata.org/pandas-docs/stable/reference/index.html 2. 통계 분석 개요 모집단(population) : 연구 대상 데이터 전체 집합 모수(parameter) : 모집단의 특성을 나타내는 수치 표본(sample) : 모집단에서 추출한 일부 데이터 통계량(statistic) : 표본의 특성을 나타내는 수치 모집단의 모수 표본의 통계량 모평균 표본평균 모분산 표본분산 모표준편차 표본표준편차 3. pandas의 var()와 numpy의 var()가 다른 이유? # Delta Degrees of Freedom..

빅데이터분석기사 실기 2022. 6. 21. 16:44

[033] 조건있는 데이터 추출 실습

1. 특정 문자열이 포함된 행 가져오기 - Series.str.contains(문자열) : 문자열이 포함된 행은 True, 아니면 False인 Series 반환 - DataFrame.loc[조건, :] : 조건이 True인 행만 가져오기 2. 통계값 알아보기 - Series.count() : 개수 - Series.sum() : 합계 - Series.mean() : 평균 - Series.std() : 표준편차 - Series.var() : 분산 - Series.median() : 중앙값 - Series.mode() : 최빈값 - Series.cumsum() : 누적합 - Series.quantile([0.25, 0.5, 0.75]) : 분위수 3. 실습 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대..

빅데이터분석기사 실기 2022. 6. 21. 15:37

[027] csv 파일 읽고 구조 확인하기

1. 필요한 라이브러리 import 2. 파일 읽어오기 - csv 파일 : pd.read_csv('파일이름', encoding='cp949', low_memory=False) encoding='cp949' : 한글이 포함되어 있는 경우 encoding 방식을 지정 low_memory=False : column에 여러 type의 데이터가 섞여 있으면 DtypeWarning이 발생하며 이때, dtype으로 타입을 명시해주거나 low_memory=False를 사용 3. 구조 확인 및 새로운 데이터 구조 생성 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 행/열이 많은 csv 읽고 구조 확인하기 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC..

빅데이터분석기사 실기 2022. 6. 21. 12:47

[026] pivot_table

1. pivot_table - DataFrame.pivot_table(index=행방향그룹열이름, columns=열방향그룹열이름, values=집계대상열이름, aggfunc=구할 통계값) - 각각에 대해 단독 또는 목록을 사용할 수 있음 - index, columns는 범주형, values는 연속형 사용 - values, aggfunc의 경우 단독의 경우 출력에 표시되지 않으나 목록은 표시됨 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 그룹별 통계 심화 학습(groupby, pivot_table) https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%A..

빅데이터분석기사 실기 2022. 6. 20. 15:50

[025] 결측치 대체하기

1. Series.mask(조건, 조건이 참일 때 사용할 값 또는 값 목록) - 조건이 True인 것에 대해 다른 값을 변경 - s.isna() : NA 값에 대해 True, NA 아닌 것은 False 2. Series.where(조건, 조건이 거짓일 때 사용할 값 또는 값 목록) - 조건이 False인 것에 대해서 다른 값으로 변경 - s.notna() : NA 값에 대해 False, NA 아닌 것은 True 3. df.groupby(그룹기준컬럼)[함수를 적용할 컬럼명].transform(함수) - index가 유지되면서 그룹별 함수 적용함 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 평균을 사용한 결측치 대체 https://www.inflearn.com/course/%EB%B9..

빅데이터분석기사 실기 2022. 6. 20. 15:36

[021] index 번호 정리하기

1. 여러 개의 DataFrame을 합친 경우, index 번호 RangeIndex로 새롭게 부여 - pd.concat([df1, df2, ...], ignore_index=True) - DataFrame.index = pd.RangeIndex(len(df)) 2. 여러 개의 DataFrame을 합친 경우 index 번호를 RangeIndex로 새롭게 부여 - pd.concat([df1, df2, ...], ignore_index=True) - DataFrame.index = pd.RangeIndex(len(df)) 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. index 번호 정리하기 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%..

빅데이터분석기사 실기 2022. 6. 20. 14:02

[017] DataFrame 컬럼/행 추가 및 삭제

1. Series 연산 - Series 끼리 또는 Series와 스칼라는 다양한 연산을 할 수 있음 - index에 맞춰 element wise 연산됨 산술연산(수치) : + - * / // % 비교연산(True/False) : > =

빅데이터분석기사 실기 2022. 6. 13. 13:54

[016] 컬럼별 함수 적용 - dataframe

1. 각 컬럼별 함수 적용 - DataFrame.apply(함수) : Series로 결과가 반환됨 - DataFrame.apply([함수1, 함수2, ...]) : DataFrame으로 결과가 반환됨 - 사용자 정의 함수, 외부 함수, 내장 함수 등 다양한 함수를 사용할 수 있음 - Series의 통계 함수들은 문자열 형태로 사용할 수 있음 : min, max, count, std, var, mean, median 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 결측치 처리, df.fillna(값) https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC..

빅데이터분석기사 실기 2022. 6. 13. 13:17

이전 Prev 1 2 3 Next 다음

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

0netw0m1ra

목록빅데이터 분석기사 (19)

0netw0m1ra

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역