일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 빅데이터 분석기사
- Linux
- error
- 워게임
- 빅분기 실기
- dreamhack
- 클라우드
- FSB
- ios frida
- [EduAtoZ]
- 풀이
- 인프런
- AWS
- centos7
- mariadb
- wireshark
- 빅데이터 분석기사 실기
- nmcli
- Python
- 빅데이터분석기사
- pwnable
- 보안뉴스
- Dreamhack.io
- 빅데이터분석기사 실기
- tcache
- Cloud
- ubuntu
- AWS Cloud
- VS Code 오류
- pandas
- Today
- Total
목록빅데이터 분석기사 실기 (21)
0netw0m1ra
- value_counts() - reset_index() - 컬럼명 변경/추가 - 데이터 정렬 - quantile : 특정 비율 위치의 값 구하기 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 폐업비율표 작성 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC
1. 특정 문자열이 포함된 행 가져오기 - Series.str.contains(문자열) : 문자열이 포함된 행은 True, 아니면 False인 Series 반환 - DataFrame.loc[조건, :] : 조건이 True인 행만 가져오기 2. 통계값 알아보기 - Series.count() : 개수 - Series.sum() : 합계 - Series.mean() : 평균 - Series.std() : 표준편차 - Series.var() : 분산 - Series.median() : 중앙값 - Series.mode() : 최빈값 - Series.cumsum() : 누적합 - Series.quantile([0.25, 0.5, 0.75]) : 분위수 3. 실습 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대..
1. 결측치는 값이 없음을 나타냄 - NaN, NaT, None 등으로 표기되며, NA Value, Missing Value라고 함 2. 결측치 확인 - DataFrame.isna() : 결측치에 대해 True, 아니면 False - DataFrame.isnull() : DataFrame.isna()와 동일함 - DataFrame.notna() : 결측치가 아닌 것에 대해 True, 결측치면 False - DataFrame.notnull() : DataFrame.isnull()과 동일함 - Series에도 결측치 확인을 위한 isna() ~ notnull()의 메서드 있음 3. 개수 세기 - DataFrame.isna().sum() : 결측치에 대해 컬럼별 개수 - DataFrame.isna().sum(..
- str.strip('제거할 문자들') : 문자열의 앞/뒤에 불필요한 것을 제거함 제거할 문자들을 지정하지 않을 경우 whitespace를 제거함 - str.split('구분자') 구분자를 지정하지 않을 경우 whitespace를 기준으로 분리함 각 구분된 내용은 str[0], str[1], ... 등으로 접근 - str.join('구분자') 분리된 문자열을 구분자들 사이에 넣어 하나의 문자열로 만듦 구분자 지정을 생략할 수 없음 ex. str.join('') - str.replace(전, 후) 문자열의 일부 내용을 변경 가능함 변경전 내용을 찾아 변경후 내용으로 바꿈 (연습) 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 데이터 전처리를 위한 str Accessor 추가 설명, ..
1. pivot_table - DataFrame.pivot_table(index=행방향그룹열이름, columns=열방향그룹열이름, values=집계대상열이름, aggfunc=구할 통계값) - 각각에 대해 단독 또는 목록을 사용할 수 있음 - index, columns는 범주형, values는 연속형 사용 - values, aggfunc의 경우 단독의 경우 출력에 표시되지 않으나 목록은 표시됨 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 그룹별 통계 심화 학습(groupby, pivot_table) https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%A..
1. 파일 합치기 - 컬럼명이 같을 때와 다를 때 비교 - axis = 1 설정 : 왼쪽에서 오른쪽으로 합치기 2. 실습 3. 참고용 - 파일이 많을 때 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 여러 개의 파일 합치기 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC
1. columns, Index 상호 변경 - DataFrame.set_index(컬럼명) : 지정한 컬럼을 index로 설정 - DataFrame.set_index([컬럼명1, 컬럼명2, ...]) : 컬럼 목록을 index(Multi index)로 설정 columns에서 index 쪽으로 이동됨, 기존 index는 제거됨 - DataFrame.reset_index() : 모든 index가 columns로 이동됨 index는 RangeIndex로 대체됨 2. Series -> DataFrame 형태로 변경 3. DataFrame 행/열 전환 - DataFrame.T : index, columns의 위치가 바뀜 4. DataFrame 컬럼 추가 - DataFrame.insert(위치, 컬럼, 값) : i..