일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Dreamhack.io
- 인프런
- Cloud
- pwnable
- nmcli
- ios frida
- Python
- 빅데이터 분석기사
- error
- VS Code 오류
- 클라우드
- centos7
- 풀이
- Linux
- 빅분기 실기
- wireshark
- AWS
- pandas
- AWS Cloud
- FSB
- dreamhack
- 보안뉴스
- [EduAtoZ]
- 빅데이터분석기사 실기
- 워게임
- 빅데이터분석기사
- 빅데이터 분석기사 실기
- mariadb
- tcache
- ubuntu
- Today
- Total
목록분류 전체보기 (204)
0netw0m1ra
1. 결측치 확인 2. heatmap https://seaborn.pydata.org/generated/seaborn.heatmap.html 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 그래프로 결측치 확인하기 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC
1. 날짜/시간 타입 변경 - 머신러닝/딥러닝에서는 날짜/시간 타입으로 데이터 분석할 수 없음. integer형태로 접근해야 함 - pd.to_datetime(Series, format='형식') %Y : 4글자 년도, %y : 2글자 년도, %m : 2글자 월, %d : 2글자 일 다양한 형식 문자들 : https://docs.python.org/3/library/datetime.html#strftime-and-strptime-behavior format의 지정이 필수는 아님 - DataFrame.insert(위치, 이름, 데이터) return이 없는 함수(inplace 동작) 2. 행/열 삭제 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 날짜 타입으로 변경하기 https://w..
1. 여러 개의 DataFrame을 합친 경우, index 번호 RangeIndex로 새롭게 부여 - pd.concat([df1, df2, ...], ignore_index=True) - DataFrame.index = pd.RangeIndex(len(df)) 2. 여러 개의 DataFrame을 합친 경우 index 번호를 RangeIndex로 새롭게 부여 - pd.concat([df1, df2, ...], ignore_index=True) - DataFrame.index = pd.RangeIndex(len(df)) 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. index 번호 정리하기 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%..
1. 파일 합치기 - 컬럼명이 같을 때와 다를 때 비교 - axis = 1 설정 : 왼쪽에서 오른쪽으로 합치기 2. 실습 3. 참고용 - 파일이 많을 때 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 여러 개의 파일 합치기 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC
1. 그룹별 통계치 구하기 - DataFrame.groupby(컬럼명).적용할통계함수() DataFrame의 함수 적용 가능 컬럼들에 대해 그룹별 통계치를 구함 통계함수에는 sum, mean, std, var, min, max, count, quantile 등이 있음 - DataFrame.groupby(컬럼명)[컬럼명].적용할통계함수() 특정 컬럼(들)에 대한 결과만 확인할 때 [컬럼명] : 결과가 Series [[컬럼명]] : 결과가 DataFrame [[컬럼명1, 컬럼명2, ...]] : 결과 DataFrame - DataFrame.groupby(컬럼명)[컬럼명].agg([통계함수1, 통계함수2, ....])를 사용함 여러 개의 통계함수를 적용 통계함수를 문자열 형식으로 사용 가능 2. 행, 열에 모..
1. columns, Index 상호 변경 - DataFrame.set_index(컬럼명) : 지정한 컬럼을 index로 설정 - DataFrame.set_index([컬럼명1, 컬럼명2, ...]) : 컬럼 목록을 index(Multi index)로 설정 columns에서 index 쪽으로 이동됨, 기존 index는 제거됨 - DataFrame.reset_index() : 모든 index가 columns로 이동됨 index는 RangeIndex로 대체됨 2. Series -> DataFrame 형태로 변경 3. DataFrame 행/열 전환 - DataFrame.T : index, columns의 위치가 바뀜 4. DataFrame 컬럼 추가 - DataFrame.insert(위치, 컬럼, 값) : i..
1. Series 연산 - Series 끼리 또는 Series와 스칼라는 다양한 연산을 할 수 있음 - index에 맞춰 element wise 연산됨 산술연산(수치) : + - * / // % 비교연산(True/False) : > =
1. 각 컬럼별 함수 적용 - DataFrame.apply(함수) : Series로 결과가 반환됨 - DataFrame.apply([함수1, 함수2, ...]) : DataFrame으로 결과가 반환됨 - 사용자 정의 함수, 외부 함수, 내장 함수 등 다양한 함수를 사용할 수 있음 - Series의 통계 함수들은 문자열 형태로 사용할 수 있음 : min, max, count, std, var, mean, median 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 결측치 처리, df.fillna(값) https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC..