Введение.
Airbnb — это сервис, который позволяет владельцам недвижимости сдавать свои помещения в аренду путешественникам, которые ищут жилье.
Путешественники могут арендовать помещение для нескольких человек, совместное пространство с отдельными комнатами или всю собственность для себя. квартира.

Краткий обзор.
Объявления Boston Airbnb были собраны и исследованы на основе межотраслевого стандартного процесса интеллектуального анализа данных (CRISP_DM).
Наборы данных для этого проекта были получены из: [email protected]
Есть три набора данных, которые я изучаю:
1. Набор данных о списках состоит из 3585 объявлений с 95 столбцами. В основном имеет дело с идентификаторами, удобствами, адресами, ценами, рейтингами отзывов и многим другим.
2. Набор данных календаря состоит из списков с 7 столбцами. Он содержит дату и время, цену, доступность.
3. Набор данных обзора состоит из списков с 5 столбцами. В нем есть обзоры, идентификаторы, столбцы даты и времени.
Наборы данных были очищены перед какой-либо предварительной обработкой.

Бизнес-вопросы, на которые мы пытаемся ответить в этом блоге:
* Самый дорогой месяц для посещения Бостона?
* Самый дорогой район Бостона?
* Каковы основные удобства, в которых нуждаются люди?
* В каком месяце люди больше всего любят приезжать в Бостон (на основе подсчета отзывов)?

Погрузитесь в данные.
В Бостоне 3585 объявлений со средней стоимостью 139 долларов США за ночь. А самый дорогой список стоил 999 долларов за ночь.
В Boston Airbnb 44,1 % объявлений имели строгую политику отмены.
59,3 % посетителей предпочли весь дом/квартиру, затем 38,4 % выбрали отдельную комнату и всего 2,2 % — общую комнату.
70% всех цен в листинге были ниже 400 долларов.

Прогнозирование цены
Чтобы предсказать цену, пропущенные значения были заполнены средним, медианным и наиболее частым значением (режимом) на основе некоторых других связанных функций. Также были удалены отсутствующие значения.
Алгоритм регрессии случайного леса и кластер K-средних использовались для набора данных и применялись для поиска основных атрибутов, связанных с ценой листингов.

  1. Самый дорогой месяц для посещения Бостона?

Самым дорогим месяцем был сентябрь со средней стоимостью бронирования $232,2 в сутки, затем следуют октябрь и ноябрь. Март и февраль считались менее дорогими месяцами.

Цена была резкой в ​​период с сентября по ноябрь и снова немного выросла в мае. С июня по август наличие стабилизировалось.

2.Самый дорогой район Бостона?

Гарвардская площадь является самым дорогим соседним городом со средней стоимостью бронирования 359 долларов в день, за ней следует Финансовый район.

3. Какие удобства больше всего нужны людям?

Среди удобств, которые больше всего понравились посетителям, были беспроводной доступ в Интернет, за которыми следовали отопление, кухня, предметы первой необходимости и детектор дыма.

4. В каком месяце люди больше всего любят приезжать в Бостон (на основе подсчета отзывов)?

Месяц август кажется самым популярным месяцем, за которым следуют июль, июнь, май. Менее загруженными месяцами будут январь, февраль и декабрь.

Регрессия случайного леса:

Random Forest Regression — лучший алгоритм для прогнозирования стоимости аренды бостонского Airbnb с r2_score 0,61.

Кластер K-средних:

Для того, чтобы найти атрибуты, связанные с ценой листинга. Я использовал метод кластеризации K-средних, чтобы разделить доступные списки на 10 кластеров. Каждый кластер будет иметь атрибуты, отличающие его от остальных кластеров.

На приведенном выше графике основными атрибутами, связанными с ценой, являются:

* property
* bed type
* neighborhood
* strict cancellation policy

Резюме:
В этом проекте я проанализировал набор данных Boston Airbnb и обнаружил много интересных явлений:
* Собрал объявления Boston Airbnb, списки календаря и списки отзывов и проанализировал, включая данные очистка, заполнение значения NAN.
* Создана модель машинного обучения для прогнозирования стоимости аренды в городе Бостон.
* Использован метод кластеризации K-средних для поиска основных атрибутов, связанных с ценой объявлений. Кластер 4 имел самую высокую среднюю цену листинга.
* Я обнаружил, что основным фактором, влияющим на цены Airbnb, были пиковые месяцы и количество людей, которое может вместить объявление. А также удобства, такие как интернет, телевидение, кондиционер, отопление... Чтобы получить очень хорошие отзывы от посетителей, очень важно отвечать на их запросы. Итак, удобства важны. Расположение также очень важно для бронирования Airbnb.

  • Я также обнаружил, что регрессия случайного леса — лучший алгоритм для прогнозирования стоимости аренды бостонского Airbnb с R2_score 0,61.

Код и подробный анализ можно найти по ссылке на GitHub:

https://github.com/shriyutha/Бостон-Airbnb