Ming's blog

미국 에어비앤비 데이터 시각화 (1) Data description 본문

공모전 및 대외활동/프로젝트

미국 에어비앤비 데이터 시각화 (1) Data description

H._.ming 2020. 1. 26. 17:24
반응형

1. Data description

1. 데이터 설명

1) 자료 : 미국의 에어비앤비 가격 및 숙소 세부 정보 데이터

 

2) 대상 지역 : New York, Los Angeles, San Francisco, Chicago, Boston, Washington, D.C, Seattle, San Diego, Hawaii (9개 도시)

 

3) 목적 : 에어비앤비 관련 데이터를 분석해 보고 각각의 데이터들이 어떠한 관련이 있는지, 그리고 각 변수들이 에어비앤비의 가격에 어떤 영향을 끼치는지 알아보고자 한다.

 

* 출처 : http://insideairbnb.com/get-the-data.html

 

2. 데이터 전처리 과정

1) 총 9개의 도시 데이터를 필요 없는 열은 제외하고 ‘state’ 변수를 추가하여 병합하였다.

 

2) 범주형 변수들은 모두 factor 처리를 하였다.

 

* 총 110,064개의 관측치, 20개의 변수

 

3. 데이터 리스트

 

no 영문명 상세 설명 데이터 유형
1 host_response_time 호스트 응답시간 범주형
2 host_response_rate 호스트 응답 비율 Numeric(%)
3 host_is_superhost 슈퍼호스트 여부 TRUE/FALSE
4 host_listings_count 호스트 리스팅 횟수 Numeric
5 host_has_profile_pic 호스트 사진 여부 TRUE/FALSE
6 host_identity_verified 호스트 신분 보증여부 TRUE/FALSE
7 state Character
8 is_location_exact 정확한 지역인지 여부 TRUE/FALSE
9 property_type 숙소 속성 범주형
10 room_type 방 종류 범주형
11 accommodates 수용 가능 인원 Numeric
12 bathrooms 욕실 개수 Numeric
13 bedrooms 침실 개수 Numeric
14 beds 침대 개수 Numeric
15 bed_type 침대 유형 범주형
16 minimum_nights 최저 숙박료 Numeric
17 maximum_nights 최고 숙박료 Numeric
18 number_of_reviews 후기 개수 Numeric
19 review_scores_rating 후기 점수 Numeric
20 price 숙박료 Numeric
반응형
Comments