일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 군집분석
- 파이썬문법
- 알고리즘
- 주피터노트북
- 머신러닝
- 디지털용어
- IT용어
- jupyternotebook
- 디지털
- 데이콘
- 은행채용
- 파이썬
- 과대완전
- 디지털직무
- 일반상식
- 은행
- 비지도학습
- IT
- Jupyter Notebook
- 금융권
- Python
- 데이터분석
- 직무역량평가
- 사전학습
- 금융
- 과소완전
- 금융상식
- dacrew
- 데이크루
- 지도학습
- Today
- Total
반응형
목록프로그래밍 기본 문법 (21)
Ming's blog
안녕하세요! 데이터 분석 업무를 하다보면 특정 폴더에 있는 파일 중, 일부를 불러와야 하는 경우가 종종 있는데요. 어떻게 하면 쉽게 파일을 불러올 수 있는지 알아보도록 하겠습니다. '알아두면 유용한 파이썬 문법' 여섯 번째는 폴더에 있는 파일 불러오기입니다. 파일을 불러오기 앞서서 폴더안에 어떤 파일들이 있는지 리스트를 만들어서 알아볼까요? import os #폴더 경로 지정하기 path='c:\\PythonHome\\blog' #해당 폴더 안에 있는 파일 리스트 불러오기 os.listdir(path) 위와 같이 os.listdir 함수를 이용하면 path 경로에 있는 파일들의 리스트를 불러 올 수 있습니다. 위의 많은 파일들 중에 csv 파일만을 불러오려면 아래와 같이 for 문과 if 문을 이용하여 ..
안녕하세요! 오늘은 시작 날짜와 끝 날짜를 이용하여 날짜 리스트를 만들어 보려고 합니다. '알아두면 유용한 파이썬 문법' 다섯 번째는 날짜 리스트 만들기입니다. 시작날짜를 2021년 11월 20일로 끝날짜를 2021년 12월 25일로 설정해서 날짜를 담은 리스트를 만들어 보겠습니다. 아래와 같이 start_date와 end_date를 설정해주고, pandas 안에 있는 date_range 함수를 이용해주면 날짜 리스트를 만들 수 있습니다. #날짜 리스트 만들기 import pandas as pd start_date='20211120' end_date='20211225' date_list=pd.date_range(start=start_date, end=end_date, freq='D') print(date..
안녕하세요! 저번에 이어서 오늘은 날짜를 이용한 연산을 해보려고 합니다. '알아두면 유용한 파이썬 문법' 다섯 번째는 날짜 연산하기입니다. 얼마 전이 빼빼로 데이였으니까 '2021년 11월 11일' 기준으로 생각해 볼까요? 빼빼로 데이 3일 전은 며칠일까요? 2021년 11월 8일! 빼빼로 데이 35일 후는? 음... 한달 하고 5일 후니까... 2021년 12월 16일? 그러면 빼빼로데이 6주 후는? 음.... 6주면... 한달 하고 2주후면... 2021년 12월... 잘 모르겠네요 ㅎㅎ 이러한 날짜 연산은 datetime의 timedelta 함수를 이용하면 쉽게 계산이 가능하답니다. 먼저, date에 2021년 11월 11일을 넣어주고 strptime을 이용해서 문자를 날짜로 변경합니다. date=..
안녕하세요~! 데이터를 다루다보면 날짜를 변환해야 하는 경우가 종종 있습니다. 날짜를 변환하는 건 할때마다 헷갈리고 같은 내용을 계속 검색하게 되죠ㅎㅎ 그래서 오늘부터는 날짜를 다루는 방법들을 알아보려고 해요~! '알아두면 유용한 파이썬 문법' 네 번째는 문자를 날짜로 날짜를 문자로 바꾸는 방법입니다. 먼저, 문자를 날짜로 바꿔볼까요? 오늘 날짜인 2021-11-12 를 date라는 변수에 저장하고 데이터 타입을 확인해 보면 아래와 같이 'str' 문자 형태인 걸 알수 있습니다. date='2021-11-12' print(date) print(type(date)) 그러면 문자를 날짜형으로 바꿔볼까요? 먼저 datetime 패키지를 import 해주고~ 다음 편에서 날짜를 이용한 연산도 해볼거라서 time..
안녕하세요! 오늘은 format 함수와 for 문을 이용해서 변수 명에 특정 리스트에 있는 값들을 넣어 자동으로 데이터를 만들어 보려고 해요! '알아두면 유용한 파이썬 문법' 세번째는 동적변수를 생성하는 방법입니다. 데이터는 seaborn의 내장 데이터인 diamonds를 사용하도록 하겠습니다. diamonds 데이터는 아래와 같은 구조로 이루어져 있습니다. import seaborn as sns diamonds=sns.load_dataset('diamonds') diamonds 저는 'cut' 변수 값에 따라 데이터를 나눠서 생성해보려고 합니다! 먼저, diamonds 데이터의 'cut' 변수를 보면 아래와 같이 5개로 이루어져 있습니다. diamonds['cut'].value_counts() 이 5개..
안녕하세요! 데이터 분석을 할 때, 특정 조건을 기준으로 데이터를 정렬하는 일이 종종 있습니다. 저같은 경우에는 행 기준으로 정렬은 익숙하였지만 열 기준 정렬은 조금 생소하였습니다. 그래서 오늘은 데이터를 특정 열 기준, 열 이름 기준으로 정렬하는 방법을 알아보고자 합니다. '알아두면 유용한 파이썬 문법' 두 번째는 데이터 정렬하는 방법입니다. 데이터는 지난번과 마찬가지로 seaborn의 내장 데이터인 car_crashes 를 사용하도록 하겠습니다. cra_crashes 데이터는 아래와 같은 구조로 이루어져 있습니다. import seaborn as sns car=sns.load_dataset('car_crashes') car.head() 먼저, car_crashes 데이터를 'abbrev' 열을 기준으..
안녕하세요! 회사에서 데이터 분석 업무를 진행하면서 검색했던 문법을 계속해서 반복적으로 검색하는 저를 발견할 수 있었습니다. 그래서 오늘부터는 제가 분석을 하며 자주 검색했던 알아두면 유용한 문법들을 정리하려고 합니다. '알아두면 유용한 파이썬 문법' 첫 번째는 특정 문자가 포함된 열만 가져오는 방법입니다. 데이터는 seaborn의 내장 데이터 중, car_crashes 를 사용하도록 하겠습니다. cra_crashes 데이터는 아래와 같은 구조로 이루어져 있습니다. import seaborn as sns car=sns.load_dataset('car_crashes') car.head() 여러 개의 열 중에서 열 이름에 'ins' 문자가 포함되어 있는 열을 가져오고자 합니다. filter 함수를 이용하면 ..
jupyter notebook에서 데이터를 불러올때, 행과 열이 많은 경우, 중간 부분이 생략되어서 나오는 경우가 많습니다. 이때, 모든 행과 열을 보고 싶은 경우가 있을 때, 이를 해결할수 있는 방법에 대해 포스팅 하겠습니다. sckit-learn 패키지에 내장되어 있는 dataset 중, load_breast_cancer dataset을 이용해보겠습니다. 다음 코드로 데이터를 출력하면 아래와 같은 형태로 행의 일부와 열의 일부가 출력됩니다. from sklearn import datasets import pandas as pd breast_cancer_data = pd.DataFrame(datasets.load_breast_cancer().data) breast_cancer_data.columns =..