Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- mariadb
- 풀이
- 빅데이터분석기사
- nmcli
- tcache
- [EduAtoZ]
- 빅분기 실기
- pandas
- 빅데이터 분석기사 실기
- ubuntu
- error
- centos7
- 워게임
- Linux
- 인프런
- Dreamhack.io
- Python
- Cloud
- VS Code 오류
- AWS Cloud
- 빅데이터분석기사 실기
- ios frida
- 빅데이터 분석기사
- pwnable
- 클라우드
- AWS
- dreamhack
- wireshark
- 보안뉴스
- FSB
Archives
- Today
- Total
0netw0m1ra
[040] 데이터 Binning(수치형 - 범주형) 본문
1. Bining(수치형 - 범주형)
- 연속형 변수를 구간을 이용하여 범주화하는 과정
- 정보가 압축되고 단순해짐(정확도는 떨어짐)
- 이상치 해결 방법 중 한가지로 사용하거나 오버피팅 방지 기법으로 사용
- (3, 6] : 3초과 6포함, right=True
- [3, 6) : 3이상 6포함하지 않음, right=False
- pd.cut()
- 비율을 사용하여 구간 나누기
pd.qcut(데이터, 구간)
구간은 0~1 사이의 숫자 사용
<출처>
인프런 - [EduAtoZ] 빅데이터분석기사 실기 대비 Part2. 데이터 Binning(수치형 - 범주형)
'빅데이터분석기사 실기' 카테고리의 다른 글
[044] Machine Learning 기본 용어 (0) | 2022.06.22 |
---|---|
[043] 기울기(회귀계수), 절편 확인, 모델 저장 (0) | 2022.06.22 |
[039] 데이터 Encoding (0) | 2022.06.21 |
[038] 데이터 스케이링(Data Scaling) (0) | 2022.06.21 |
[037] 데이터 변환 (0) | 2022.06.21 |