Всем известно, что испанские города славятся отличной погодой, отличной едой и удобством для туристов. Тем не менее, эти города принимают миллионы туристов в течение года, что приводит к большей конкуренции в сфере туризма и гостиничного бизнеса, более высоким ценам и меньшей доступности. Вот почему Airbnb может быть хорошим решением для проверки. В этом посте проанализированы два главных города Испании, Мадрид и Барселона.

Используемые наборы данных загружены из Airbnb Madrid и Airbnb Barcelona. Эти наборы данных состоят из трех файлов CSV:

  • Файл списков: этот файл включает в себя количество комнат, кроватей и ванных комнат, какие удобства включены, сколько мест может быть в этом объекте, тип объекта, тип номера. , цена объекта, координаты где находится, район где находится и многое другое.
  • Файл календаря. В этот файл включены все объекты недвижимости на 2021 год, доступны они или нет, а также цена за день.
  • Файл отзывов. В этом файле содержится мнение пользователя об объекте. Этот файл не используется в этом проекте.

У Airbnb из Мадрида есть 20 352объектов, а у Airbnb в Барселоне — 19 641объявлений с 74 столбцы с информацией об этом, как упоминалось ранее.

После наблюдения за обоими наборами данных пришло время поставить несколько вопросов над таблицей, чтобы ответить на них, проанализировав данные:

1. Цены на Airbnb выше или ниже средней цены отеля в Барселоне или Мадриде?

2. Сколько люди будут платить в 2021 году, если они поедут в Барселону или Мадрид?

3. Какие типы размещения доступны и какие удобства наиболее популярны?

4. Когда лучше всего посетить Барселону и Мадрид?

5. Какие характеристики лучше описывают стоимость проживания?

  1. Цены на Airbnb выше или ниже средней цены отеля в Барселоне или Мадриде?

Согласно странице Рассчитывайте бюджет поездки, средняя цена отеля в Барселоне составляет около 177 долларов США за пару/ночь, что составляет 88,5 долларов США на человека/ночь, а стоимость отеля в Мадриде составляет около 130 долларов США. за пару/ночь, что составляет 75 долларов США с человека/ночь.

Из рисунка 1 видно, что недвижимость от Airbnb в обоих городах ниже, чем цена за ночь в среднем отеле, так как для пары цена за ночь составляет менее 100 долларов. График также показывает, что аренда жилья Airbnb до 8 человек в Мадриде немного дороже, чем в Барселоне.

Как видно на Рисунке 2, цены на большинство объектов ниже 200 долларов, поэтому все объявления дороже 200 долларов были отброшены. Это привело к отбрасыванию 6% объявлений с Airbnb Barcelona и 8% с Airbnb Madrid.

2. Сколько люди будут платить в 2021 году, если поедут в Барселону или Мадрид?

Как упоминалось ранее, мы видим, что средняя цена в Мадриде выше, и это также отразится в 2021 году. Что любопытно в обоих городах, так это то, что средние цены будут расти каждый месяц. В Барселоне первая неделя июня и первая неделя июля будут дороже, так как обычно это период, когда большинство туристов отправляются в отпуск, чтобы посетить город. Но четкой тенденции в течение года нет, и это может быть связано со всем туристическим кризисом, вызванным коронавирусом.

Если мы увеличим масштаб во временном измерении и сосредоточим внимание на днях недели, можно увидеть тенденцию в обоих городах. Средний рост цен на недвижимость в начале выходных.

3. Какие типы размещения доступны и какие удобства наиболее популярны?

На Рисунке 5 показано, что тип недвижимости, который пользователь Airbnb найдет в Барселоне и Мадриде, составляет 43% и 50%, соответственно, целые квартиры и 40% и 30%, соответственно, отдельные комнаты. Более 70% объектов имеют некоторые из основных удобств, таких как Wi-Fi, предметы первой необходимости, кухня, отопление, стиральная машина и т. д. Удивительно, но только 60% объектов имеют горячую воду в обоих городах, что меньше, чем те, которые имеют фен включен, что составляет около 70% свойств.

4. Когда лучше всего посетить Барселону и Мадрид?

Если вы хотите провести несколько дней в Барселоне или Мадриде в период с последних дней зимы до первых дней лета, вам будет сложно найти то, что вы ищете, так как доступно менее 50% объектов недвижимости и в период с февраля а в марте доступность составляет даже около 40%. Но если вы хотите провести несколько дней летом или осенью, вы найдете больше вариантов на выбор.

Когда мы говорим, что у вас будет мало вариантов выбора, это потому, что все апартаменты, общая комната в отеле, вся кровать и завтрак полностью забронированы на следующие 30 дней в обоих городах. Но если вы хотите провести несколько дней с семьей или друзьями в более просторной собственности, вы можете найти целый таунхаус или частный дом, где заполняемость составляет около 80% и 70% соответственно.

С помощью этих графиков мы можем видеть, насколько популярны оба города, что максимальная доступность в течение года составляет всего 60%, а данные проверяются на 11 месяцев вперед. И недвижимость, которая более популярна среди пользователей Airbnb, — это когда-то упомянутая ранее, более 70% этого типа недвижимости занято в течение следующих 30 дней.

5. Какие характеристики лучше описывают стоимость проживания?

Чтобы ответить на этот вопрос, мне пришлось сначала разобраться с пустыми значениями, вменив среднее значение числовым переменным и моду категориальным переменным.

Как упоминалось ранее, свойства-выбросы были удалены, так как о них было недостаточно информации. В наборах данных было только 6% и 8% свойств в диапазоне от 201 до 12000 долларов. Наличие такого большого диапазона с таким небольшим обучением не идеально для обучения модели предсказанию цены и оценке важности функции.

На рисунке 7 показана корреляция всех независимых переменных, используемых для обучения модели, с ценой зависимой переменной. Можно увидеть, что из обоих наборов данных 3 переменные, оказывающие большее влияние, — это размещение, а тип комнаты, являющийся домом/квартирой, имеет положительный коэффициент в обоих наборах данных, а тип комнаты в отдельной комнате также имеет отрицательный коэффициент в обоих наборах данных. модели.

Модель, используемая с обоими наборами данных, была Gradient Boosted Tree от sklearn. После настройки гиперпараметров и получения R2 0,9 при обучении обеих моделей и R2 0,55 с данными тестирования можно было проанализировать важность функции. Но прежде упомянем, что причина того, что оценка с данными тестирования настолько низка, заключается в том, что большая часть данных в обоих наборах данных, как показано на рисунке 2, находится в нижней части ценового графика, и в нем осталось не так много данных. более высокий конец.

На рисунке 8 показана важность функций обеих моделей. Здесь можно увидеть, что между обоими наборами данных больше различий. Модель, обученная с использованием данных Airbnb Barcelona, ​​обнаружила, что более важной является информация, полученная от количества помещений, а модель, обученная с использованием данных Airbnb Madrid, обнаружила, что более важной является информация, полученная от типа комнаты, представляющей собой целый дом/квартиру. Важность характеристик с другими независимыми переменными более или менее схожа с некоторыми небольшими различиями между переменными количества спален или минимального количества ночей, которые гости могут проживать в объекте размещения.

Выводы

В этой статье мы могли видеть, что даже в разгар пандемии Барселона и Мадрид по-прежнему остаются популярными городами для туристов, хотя цены на этот 2021 год не ожидаются низкими, поскольку в некоторые месяцы цена Airbnb в обоих городах будет равна или выше средней цены проживания в гостинице.

Для получения дополнительной информации о том, как были созданы различные графики, пожалуйста, посетите Github проекта.