일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 빅데이터분석기사 실기
- nmcli
- pwnable
- AWS
- Dreamhack.io
- 보안뉴스
- 빅데이터 분석기사 실기
- Linux
- 클라우드
- Python
- VS Code 오류
- 빅데이터분석기사
- centos7
- dreamhack
- 빅분기 실기
- mariadb
- ios frida
- pandas
- 풀이
- AWS Cloud
- tcache
- 인프런
- 워게임
- wireshark
- error
- [EduAtoZ]
- Cloud
- 빅데이터 분석기사
- FSB
- ubuntu
- Today
- Total
목록Python (17)
0netw0m1ra
1. 필요한 라이브러리 import 2. 파일 읽어오기 - csv 파일 : pd.read_csv('파일이름', encoding='cp949', low_memory=False) encoding='cp949' : 한글이 포함되어 있는 경우 encoding 방식을 지정 low_memory=False : column에 여러 type의 데이터가 섞여 있으면 DtypeWarning이 발생하며 이때, dtype으로 타입을 명시해주거나 low_memory=False를 사용 3. 구조 확인 및 새로운 데이터 구조 생성 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 행/열이 많은 csv 읽고 구조 확인하기 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC..
- UnicodeDecodeError 해결 1 ) encoding='cp949' 추가 해결 2 ) csv 파일을 메모장으로 읽어서 다른 이름으로 저장할 때 utf-8로 저장해서 이용하기 - DtypeWarning 경고 : 39, 44 인덱스의 타입 경고 해결 ) 타입을 직접 확인하고 미리 알려주기 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 행/열이 많은 csv 읽고 구조 확인하기 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%AC
1. pivot_table - DataFrame.pivot_table(index=행방향그룹열이름, columns=열방향그룹열이름, values=집계대상열이름, aggfunc=구할 통계값) - 각각에 대해 단독 또는 목록을 사용할 수 있음 - index, columns는 범주형, values는 연속형 사용 - values, aggfunc의 경우 단독의 경우 출력에 표시되지 않으나 목록은 표시됨 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 그룹별 통계 심화 학습(groupby, pivot_table) https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%A..
1. 통계값 구하기 - DataFrame.describe() : 적용 가능 컬럼에 대해 count, mean, std, min, max, Q1, Q2, Q3 등의 통계값 구하기 describe()는 수치형 자료에 대해서만 계산해서 보여줌 min, max는 object(string) 형태도 포함해서 계산됨. 따라서, 문자열이 포함되어 정렬됨 문자열 정렬시에는 문자의 코드값을 사용함 -> ord(문자) - Series.count() : 개수 - Series.sum() : 합계 - Series.mean() : 평균 - Series.std() : 표준편차 - Series.var() : 분산 - Series.median() : 중앙값 - Series.mode() : 최빈값 - Series.quantile() : ..
1. Series의 value가 목록에 포함된 내용인지 확인 - Series.isin([내용1, 내용2, ...]) : Series에 포함된 내용이 목록에 있는 경우 True, 없으면 False인 bool series 반환(boolean indexing에 사용) 2. Series의 str Accessor 사용 - str.contains('문자열') : 특정 문자열을 포함하는지 아닌지 판단(반환 : True/False) - str.upper() : 영문자를 소문자->대문자 - str.lower() : 영문자를 대문자->소문자 - 세부 내용 : https://pandas.pydata.org/docs/reference/series.html#string-handling 3. Series의 데이터를 list 및 ..
map(function, *iterable) - iterablbe의 각 item에 function이 적용되어 map 객체 반환 - function의 parameter 개수 == iterable 의 개수(NOT item의 개수) - next()할 때마다, function의 동작 결과가 반환됨 - iterable의 item 개수 만큼 next()를 사용할 수 있음 - iterable들의 같은 위치 item이 func의 arguent로 사용되어 func이 실행되고, 그 결과가 next에 의해 반환됨 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part1. map 함수, comprehension 연습 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D..
enumerate(iterable, start=0) - iterable의 item에 순서 번호가 함께 필요할 때 사용함 - next() 할 때마다 (index, item)의 tuple을 반환 - iterable의 item 개수 만큼 next()를 사용할 수 있음 zip(*iterable) - 동일한 개수로 이루어진 자료형의 같은 위치 item을 묶어줌 - zip 객체는 iterator - 두 개의 객체가 있을 때, 하나는 키로 하나는 데이터로 사용해 딕셔너리로 만들 수 있음 인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part1. enumerate, zip 함수 https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B..
- positional or keyword parameter (a, b, c) parameter 앞쪽으로 *, 뒤쪽으로 , / 가 없음 - positional only parameter (a, b, /) #python v3.8+) parameter 뒤쪽으로 , / 가 있음 - keyword only parameter (*, a, b) (*a, b, c) parameter 앞쪽으로 * , 가 있음(이름과 떨어진 상태로) - var-positional parameter (*a) parameter 이름에 *가 하나 붙어 있음 tuple 형태로 전달됨 "a=10" 과 같이 공백없게 쓰는 것이 좋음 - var-keyword parameter (**a) parameter 이름에 *이 두 개 붙어 있음 dict 형태..