일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 데이콘
- 금융상식
- 직무역량평가
- IT용어
- Python
- 사전학습
- 일반상식
- 디지털
- 금융
- 은행
- 과소완전
- 머신러닝
- 데이터분석
- 파이썬
- 디지털용어
- 지도학습
- Jupyter Notebook
- jupyternotebook
- 디지털직무
- 데이크루
- 주피터노트북
- IT
- 알고리즘
- dacrew
- 파이썬문법
- 은행채용
- 과대완전
- 군집분석
- 비지도학습
- 금융권
- Today
- Total
반응형
목록데이터 분석 (5)
Ming's blog
안녕하세요! 오늘 소개드릴 책은 이기적 출판사의 '2023년 빅데이터 분석기사 실기' 교재 입니다. 빅데이터 분석기사 실기 시험은 필답형과 작업형으로 이루어져 있는데요. 필답형의 경우, 필기 시험에서 공부하셨던 부분에서 10문제 정도 단답형으로 답하는 유형입니다. 또한, 작업형의 경우, 직접 프로그램을 통해 분석을 진행하는 유형으로 언어로 python이나 R 등을 사용할 수 있습니다. 빅데이터 분석기사를 준비하며 어떤 교재를 사용해야할지 고민이 많으셨을 텐데요. 교재 선택에 조금이나마 도움이 되고자 이 교재에 대한 평을 남겨보려고 합니다. 이기적 교재는 1권 필답형 + 파이썬 분석, 2권 R분석으로 이루어져 있습니다. 보통, 빅데이터 분석기사 교재는 내용이 많아 굉장히 두꺼워 휴대하기 어려웠던 경험이 많..
안녕하세요! 오늘은 길벗 출판사의 '가장 빨리 만나는 스벨트' 교재 리뷰를 진행해보려고 합니다. 최근에 웹 페이지를 만드는 업무를 진행하면서 스벨트에 대해 처음 알게 되었는데요. 스벨트는 굉장히 직관적이고 짧은 문법으로 이루어져 있어, 프론트엔드 개발이 처음인 저도 어렵지 않게 웹 개발을 할 수 있었습니다. 그런데, 스벨트는 다소 최근에 만들어진 프레임워크이기에 참고 자료가 다소 부족하여 공부하는데 어려움이 있었습니다. 이 책은 저와 같이 스벨트를 처음 입문하는 분들에게 굉장히 많은 도움을 줄거라 생각됩니다. 이 책의 장점 중 크게 3가지 정도를 소개해보려고 합니다. 첫 번째로, ✅ 예제 코드와 각 코드에 대한 주석 제공 스벨트 코드를 공부하다보면 해당 코드가 어떤 기능을 하는지 알기 어려운 경우가 종종..
안녕하세요! 오늘은 요즘 핫한 빅데이터 분석기사 자격증 실기시험 대비 교재인 '데이터 캠퍼스의 2022 공개적 빅데이터분석기사 실기' 교재 리뷰를 해보려고 합니다. 먼저, 교재는 아래와 같은 모습입니다. 2021년 베스트 셀러 1위였다고 하네요 ㅎㅎ 교재의 저자는 20년 경력의 여러권의 머신러닝/딥러닝 관련 책을 출간하신 김원표 교수님입니다. 그럼 교재의 구성을 살펴볼까요? 교재는 크게 "단답형 대비"와 "작업형 대비"로 이루어져 있습니다. "단답형 대비" 파트는 빅데이터 분석기사 단답형 기출문제와 예상문제로 이루어져 있습니다. 단답형 부분을 대비하기 위해서는 기존에 공부하던 필기교재로 개념 숙지 후, 단답형 대비 파트를 모의고사 느낌으로 풀어보면 좋을 것 같습니다. "작업형 대비" 파트는 빅데이터 분석..
1. Modeling 앞에서 처리한 데이터를 이용하여 분석을 해보고자 합니다. 여러가지 모델 중 xgboost 와 randomforest를 이용한 분석을 하려고 합니다. 1.1. xgboost train 데이터를 train_test_split 함수로 7:3으로 나누어 CV방법을 이용하여 모델을 생성하고자 합니다. 우리가 예측하고자 하는 타켓변수는 0 또는 1의 값을 가지므로 XGBClassifier 모델을 이용하려 합니다. import xgboost as xgb from sklearn.model_selection import train_test_split from sklearn.metrics import classification_report, accuracy_score #train 변수 나누기 X, y..
파이썬을 이용하여 kaggle에서 가장 기본으로 알려진 타이타닉 데이터를 분석하고자 합니다. 먼저, 데이터 분석에 앞서 필요한 패키지들을 불러옵니다. numpy와 pandas 그리고 시각화를 위함 matplotlib과 seaborn을 불러오겠습니다. 또한, 통계분석을 위해 scipy와 NA값을 쉽게 보여주는 missingno를 불러오겠습니다. 마지막으로, warnings를 불러와 필요없는 경고 메시지를 표현하지 않도록 하였습니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from scipy import stats %matplotlib inline #na값 쉽게 보는 함수 impor..