일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- pandas
- pwnable
- dreamhack
- wireshark
- error
- VS Code 오류
- centos7
- 빅분기 실기
- 빅데이터 분석기사
- nmcli
- 빅데이터분석기사
- 인프런
- Dreamhack.io
- tcache
- Cloud
- Python
- FSB
- AWS
- 워게임
- 빅데이터분석기사 실기
- 빅데이터 분석기사 실기
- AWS Cloud
- 풀이
- 보안뉴스
- Linux
- ios frida
- mariadb
- [EduAtoZ]
- 클라우드
- ubuntu
- Today
- Total
목록전체 글 (204)
0netw0m1ra
1. 필요한 라이브러리 import 2. 파일 읽어오기 - csv 파일 : pd.read_csv('파일이름', encoding='cp949', low_memory=False) encoding='cp949' : 한글이 포함되어 있는 경우 encoding 방식을 지정 low_memory=False : column에 여러 type의 데이터가 섞여 있으면 DtypeWarning이 발생하며 이때, dtype으로 타입을 명시해주거나 low_memory=False를 사용 3. 구조 확인 및 새로운 데이터 구조 생성 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 행/열이 많은 csv 읽고 구조 확인하기 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC..
- UnicodeDecodeError 해결 1 ) encoding='cp949' 추가 해결 2 ) csv 파일을 메모장으로 읽어서 다른 이름으로 저장할 때 utf-8로 저장해서 이용하기 - DtypeWarning 경고 : 39, 44 인덱스의 타입 경고 해결 ) 타입을 직접 확인하고 미리 알려주기 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 행/열이 많은 csv 읽고 구조 확인하기 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC
1. pivot_table - DataFrame.pivot_table(index=행방향그룹열이름, columns=열방향그룹열이름, values=집계대상열이름, aggfunc=구할 통계값) - 각각에 대해 단독 또는 목록을 사용할 수 있음 - index, columns는 범주형, values는 연속형 사용 - values, aggfunc의 경우 단독의 경우 출력에 표시되지 않으나 목록은 표시됨 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 그룹별 통계 심화 학습(groupby, pivot_table) https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%A..
1. Series.mask(조건, 조건이 참일 때 사용할 값 또는 값 목록) - 조건이 True인 것에 대해 다른 값을 변경 - s.isna() : NA 값에 대해 True, NA 아닌 것은 False 2. Series.where(조건, 조건이 거짓일 때 사용할 값 또는 값 목록) - 조건이 False인 것에 대해서 다른 값으로 변경 - s.notna() : NA 값에 대해 False, NA 아닌 것은 True 3. df.groupby(그룹기준컬럼)[함수를 적용할 컬럼명].transform(함수) - index가 유지되면서 그룹별 함수 적용함 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 평균을 사용한 결측치 대체 https://www.inflearn.com/course/%EB%B9..
1. DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False) - 결측치 제거에 사용되는 메서드 - how='any' : 결측치가 하나라도 포함된 행 삭제 - how='all' : 모든 데이터가 결측치인 행 삭제 - axis=1 : 컬럼에 대해 동작 - thresh=숫자 : 숫자 이상의 데이터를 가진 행은 삭제 안함 - subset=[컬럼이름1, ...] : subset으로 지정된 컬럼만 사용하여 삭제 대상 검색 2. df.groupby(by=[컬럼1, 컬럼2, ...]).함수() - 그룹 기준으로 목록을 지정하면 MultiIndex로 만들어짐 - MultiIndex인 경우의 indexing은 tuple을 사용함 - ['년'..
1. 결측치 확인 2. heatmap https://seaborn.pydata.org/generated/seaborn.heatmap.html 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 그래프로 결측치 확인하기 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC
1. 날짜/시간 타입 변경 - 머신러닝/딥러닝에서는 날짜/시간 타입으로 데이터 분석할 수 없음. integer형태로 접근해야 함 - pd.to_datetime(Series, format='형식') %Y : 4글자 년도, %y : 2글자 년도, %m : 2글자 월, %d : 2글자 일 다양한 형식 문자들 : https://docs.python.org/3/library/datetime.html#strftime-and-strptime-behavior format의 지정이 필수는 아님 - DataFrame.insert(위치, 이름, 데이터) return이 없는 함수(inplace 동작) 2. 행/열 삭제 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 날짜 타입으로 변경하기 https://w..
1. 여러 개의 DataFrame을 합친 경우, index 번호 RangeIndex로 새롭게 부여 - pd.concat([df1, df2, ...], ignore_index=True) - DataFrame.index = pd.RangeIndex(len(df)) 2. 여러 개의 DataFrame을 합친 경우 index 번호를 RangeIndex로 새롭게 부여 - pd.concat([df1, df2, ...], ignore_index=True) - DataFrame.index = pd.RangeIndex(len(df)) 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. index 번호 정리하기 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%..
1. 파일 합치기 - 컬럼명이 같을 때와 다를 때 비교 - axis = 1 설정 : 왼쪽에서 오른쪽으로 합치기 2. 실습 3. 참고용 - 파일이 많을 때 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 여러 개의 파일 합치기 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC