일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 파이썬
- IT
- 파이썬문법
- 머신러닝
- 주피터노트북
- IT용어
- 비지도학습
- 금융상식
- 금융
- 알고리즘
- Python
- dacrew
- 일반상식
- 과소완전
- 은행
- 군집분석
- 과대완전
- 지도학습
- Jupyter Notebook
- 금융권
- 사전학습
- 디지털용어
- 데이콘
- 직무역량평가
- 디지털직무
- jupyternotebook
- 데이터분석
- 데이크루
- 디지털
- 은행채용
- Today
- Total
반응형
목록randomforest (2)
Ming's blog
안녕하세요~! 오늘 소개해드릴 내용은 지도학습 기반 머신러닝 모델 이론과 실습입니다. 이번 실습에서 사용한 데이터는 kaggle의 Credit Card Fraud Detection Dataset입니다! 신용카드 사기 탐지 모델을 만드는 것이 저희의 최종 목표인데 그 전에 EDA 기법부터 지도학습 기반의 머신러닝 기법에 대해 조사하였습니다. 지도학습 기반의 머신러닝 모델로는 간단한 Logistic regression 부터 Decision Tree, 배깅을 이용하는 Random Forest, 부스팅 기법을 이용하는 Gradient Boosting, XGBoost, LightGBM 까지 조사해보았습니다. 이론과 함께 해당 모델로 실습까지 진행하였습니다! 더 자세한 내용은 아래의 링크를 참고해주세요😊 감사합니다..
1. Modeling 앞에서 처리한 데이터를 이용하여 분석을 해보고자 합니다. 여러가지 모델 중 xgboost 와 randomforest를 이용한 분석을 하려고 합니다. 1.1. xgboost train 데이터를 train_test_split 함수로 7:3으로 나누어 CV방법을 이용하여 모델을 생성하고자 합니다. 우리가 예측하고자 하는 타켓변수는 0 또는 1의 값을 가지므로 XGBClassifier 모델을 이용하려 합니다. import xgboost as xgb from sklearn.model_selection import train_test_split from sklearn.metrics import classification_report, accuracy_score #train 변수 나누기 X, y..