Дорогие друзья!

Добро пожаловать в AP-Airbnb#1, наш первый проект прикладной аналитики! 👋Джеймс Калео Кистнер,👋Синдху Айенгар и👋моя скромная личность проведут вас через наш первый прикладной проект вместе с цель представить вам пример того, как вы можете применять описательные, прогнозные, визуальные и другие инструменты аналитики, которые вы приобрели до сих пор. Сегодня в центре внимания Airbnb, так что давайте начнем!

Значительная доля роста сегодняшней экономики совместного использования обусловлена ​​поставщиками однорангового (P2P) жилья, такими как Airbnb. Инновационная платформа для путешественников, позволяющая найти уникальное, дешевое и удобное место для проживания, а также популярная для многих возможность получения пассивного дохода от краткосрочной аренды (STR). Но кажется, что в последнее время индустрия аренды жилья для отпуска движется в другом направлении. Хостинг все больше переплетается с социальными и институциональными структурами, а профессионально разработанные, институционально финансируемые и целенаправленно разработанные Airbnbs занимают все большую долю рынка. Кроме того, низкие ставки по ипотечным кредитам (в прошлом) и рост культуры удаленной работы вызвали структурный сдвиг на рынке, который привел к увеличению доли заемных средств со стороны розничных инвесторов и большому летнему релизу Airbnb в этом году.

Как только хозяева подумали, что узнали, как устроен мир после Covid19, окружающая среда снова изменилась. Ипотечные ставки растут, рынки недвижимости трясутся, и, возможно, новая рецессия стучится в наши двери. Вдохновение для нас, чтобы запустить проект, ориентированный на факторы ценообразования на рынке STR.

1) ЦЕЛЬ

гедонистические модели ценообразования являются рабочей лошадкой в ​​сфере недвижимости, которую часто можно увидеть в (объяснительных) эконометрических или финансовых моделях ценообразования активов и (предиктивных) моделях машинного обучения. Многофакторная схема, которая предполагает, что оценку стоимости жилья можно рассматривать как взвешенную сумму его характеристик (например, расположение, количество комнат, удобства, парковка, бассейн). В нашем случае гедонистический подход дает нам элегантную основу для оценки посуточной арендной платы за наши объекты Airbnb, где модель измеряет движущие силы различных функций, за которые гости готовы платить.

Первая часть нашей серии в первую очередь будет посвящена изложению нашей первоначальной гипотезы, поиску данных, их очистке и исследовательскому анализу данных. Информация, полученная в первой части, станет основой для нашей части прогнозного моделирования, в которой мы подробно рассмотрим использование моделей машинного обучения для понимания структуры ценообразования на рынке STR и предоставим первые полезные идеи, прежде чем мы продолжайте углубляться в текстовый анализ в третьей части.

2) ГИПОТЕЗА

Целевой переменной (y) этого проекта является «дневной показатель», который будет изучаться на основе массивов данных, собранных в ноябре 2022 года. После нескольких сессий на доске и исследования контекста мы сузили наш анализ до следующих основных факторов и гипотез будет оценивать в этой серии:

📂МЕСТО: местоположение, местоположение, местоположение. Это правило номер один при инвестировании в недвижимость — мы ожидаем, что «местоположение» будет надежной характеристикой ценообразования, но нас также интересует, как города или возможные кластеры напрямую влияют на другие характеристики в нашем наборе данных или на нашу модель ценообразования.

📂ФИЗИЧЕСКИЕ ХАРАКТЕРИСТИКИ:

Пространство. Мы предполагаем, что вместимость Airbnbs оказывает существенное влияние на ценообразование: чем больше гостей, тем выше может быть ставка. Вопрос в том, как эти модели ценообразования ведут себя при увеличении размера собственности. Более того, меняется ли оптимальный уровень цен на одного гостя в зависимости от различных факторов? Недавние тенденции показывают, что люди начали ценить большее пространство во время Covid19, что ставит нас перед вопросом, можем ли мы найти хорошие способы оценки доступного пространства (поскольку Airbnb не предоставляет квадратные метры).

— Тип: такие типы номеров, как "отдельная комната" и "целый дом", скорее всего, имеют разную цену, в первую очередь из-за площади. Предполагается, что степень конфиденциальности, которую может предложить место, также является ключевым фактором в ставках.

— Удобства. Удаленная работа и растущая база инвесторов в среде Airbnb повлияли на ожидаемые удобства в объекте размещения. Мы более подробно рассмотрим влияние переменных, которые мы можем извлечь, но уделим особое внимание популярным из них, таким как Интернет, потоковое вещание и содержание домашних животных.

📂КАЧЕСТВО: Airbnb напрямую конкурирует с отелями. Следовательно, гости, скорее всего, не захотят принимать низкокачественные услуги Airbnb, если они могут остановиться в отеле всего на несколько долларов дороже. Airbnbs не классифицируется по количеству звезд, как отели, но веб-сайт предоставляет нам несколько функций для оценки качества места, таких как рейтинги, комментарии к отзывам и статус суперхозяина. Тем не менее, мы должны предвидеть проблемы с размером выборки и систематической ошибкой выживания. Airbnb довольно настойчив, когда дело доходит до того, чтобы вы проверили свое последнее пребывание, но все же не все это делают.

📂ПЛАТА.Последнее обсуждение в сообществах Airbnb и социальных сетях в основном касалось платы за уборку. Гости жалуются на чрезмерную плату или дополнительную работу по уборке на кассе. Мы предполагаем, что плата за уборку (или работу по дому) начинает влиять на способность хозяина взимать ту же плату.

📂СПРОС. Второй основной компонент уравнения дохода хозяина, наряду со стоимостью аренды, — заполняемость (цена * количество бронирований = доход). Стоимость номера может отражать «справедливую стоимость» с учетом суммы всех функций, но если бронирований мало или совсем нет, хозяин не получит дохода. Экономический спад, чрезмерное предложение или недостаточная видимость могут вынудить хозяина снизить уровень цен. Мы предполагаем, что взаимосвязь между уровнем цен и спросом является положительной, но, вероятно, непостоянной из-за ее временных характеристик и сложности получения надежных и полных данных.

3) ПОИСК ДАННЫХ

Первым препятствием, с которым мы столкнулись, была проблема сбора данных. В 2017 году Airbnb решила ограничить доступ к своему API для потенциальных деловых партнеров. Спасибо Airbnb за усложнение нашей жизни! Вторичные внешние источники, такие как Kaggle или opendatasoft, предоставили ценные наборы данных (особенно временные ряды), но не соответствовали нашим потребностям с точки зрения конкретных данных об объекте. Извлечение данных непосредственно с веб-сайта оставалось лучшим вариантом. Сначала мы собрали небольшую выборку вручную, чтобы лучше понять технические, функциональные и визуальные компоненты веб-сайта, а также провести предварительный анализ данных. Поскольку это оказалось многообещающим, мы разработали парсер на 🖥️Python (библиотека Selenium) и развернули его для сбора данных в масштабе.

4) ОБЗОР ДАННЫХ

Мы определили следующие элементы как количественные характеристики, которые мы извлекли и оценили в следующих разделах.

5) ПРОВЕРКА И ОЧИСТКА ДАННЫХ

Чтобы смягчить любые дефекты модели и сценарии «мусор на входе = мусор на выходе», мы внедрили правила проверки данных в наш процесс парсинга веб-страниц и код предварительной обработки в 🖥️R. Вот несколько правил проверки, которые команда решила внедрить:

  • типы данных (например, целое число, строка, число с плавающей запятой)
  • диапазон (например, количество спален или сборов, отрицательные значения)
  • согласованные выражения (например, название города, удобства)

Кроме того, были реализованы несколько сценариев очистки данных для дедупликации (удаления избыточности), разделения и преобразования данных, а также инструменты для раннего выявления и удаления статистических выбросов. Например, в нескольких единицах «студия» была указана как количество спален вместо 0, показывалась отрицательная плата за уборку или обслуживание, а в списках «общих» функций отсутствовала информация или они оказывались вводящими в заблуждение. Мы также решили отказаться от нескольких косметических средств из-за небольшого размера выборки и сгруппировали 292 косметических средства в 71 категорию, поскольку некоторые из них очень похожи (например, «шампунь Pantene» и «шампунь Puracy). ') и сгруппировали 212 городов в 12 районов в зависимости от расстояния. На этом этапе крайне важно, чтобы вы просмотрели набор данных с членом команды или даже со всей командой, чтобы обсудить возможные проблемы, возникшие в процессе сбора или очистки данных, и оценить последствия сделанных предположений, чтобы предотвратить вводящие в заблуждение результаты.

6) Исследовательский анализ данных (EDA)

Исследовательский анализ данных — это подход к пониманию, анализу и обобщению данных. Это поможет нам обнаруживать выбросы и аномалии, раскрывать основные структуры и закономерности, извлекать идеи и важные особенности и, что наиболее важно, проверять наши гипотезы и предположения. Существует целый ряд инструментов от простых одномерных методов для изучения каждой переменной в отдельности до более сложных и требовательных многомерных методов, которые учитывают существующие отношения между переменными.

6.1) ОПИСАТЕЛЬНЫЙ И ОДНОМЕРНЫЙ АНАЛИЗ (UVA)

Мы начнем наш количественный анализ с создания полного набора диаграмм для изучения одномерных характеристик наших переменных. Наиболее часто используемые одномерные методы — это сводки, графики композиций/распределений, квантильное картирование и инструменты, предназначенные для оценки характеристик нормальности. Нашим основным аналитическим инструментом для этого раздела является 🖥️Tableau, но время от времени к нему подключались 🖥️R и 🖥️Excel для поддержки обработки данных.

Мы собрали 3619 объявлений Airbnb в Калифорнии, США. Мы сосредоточились на популярных и хорошо зарекомендовавших себя местах вдоль побережья, прежде всего вокруг Лос-Анджелеса и Сан-Франциско.

🎯DailyRates (наша переменная y): ежедневные ставки являются основным компонентом дохода для наших хозяев Airbnb. Цены указаны в долларах США без учета скидок, сборов или налогов.

Как показано на рисунке выше, переменная широко разбросана, но имеет очень правый перекос. Медиана близка к 140 долларам за ночь за место, но цены могут доходить до четырехзначных цифр.

1️⃣Местоположение: Калифорния с населением 39,5 млн человек представляет 14,6% всей экономики США, что делает ее одной из крупнейших экономик мира. Золотой штат является одним из самых посещаемых штатов США (260 миллионов посетителей в год) и известен своим самым большим разнообразием региональных ландшафтов, климатических зон, флоры и фауны. Его экономический статус и разнообразие делают его очень интересным, но в то же время неоднородным рынком краткосрочной аренды, который мы можем проанализировать.

Как вы можете видеть на карте выше, наши наборы данных охватывают территорию от Сан-Диего до Сакраменто, прибл. 500 миль, что охватывает большинство населенных пунктов (светло-зеленые районы).

2️⃣Физические характеристики. Здесь мы фокусируемся на физических характеристиках и удобствах самой собственности, таких как указанная вместимость, количество кроватей/спальней/ванных комнат, удобства, а также тип номера.

Как и ожидалось, переменные, связанные с пространством, как правило, сильно искажены вправо, поскольку большинство хозяев Airbnb предлагают в аренду часть своего дома или меньшую инвестиционную недвижимость (в основном квартиры). Удивительно, но 74% нашего набора данных озаглавлены весь дом, что немного выше, чем ожидалось, но все еще находится в разумных пределах по сравнению с другими исследованиями в этой области (см. AirDNA). Увеличение числа может быть следствием смены парадигмы, которую мы все испытали во время Covid19, или результатом предвзятости при отборе в нашем парсере. Общая комната представляла 0,7% наших наборов данных и была удалена из этого исследования из-за проблем с размером выборки.

3️⃣Качество.Система рейтинга на Airbnb позволяет гостям после выезда оценить хозяина по шкале от 1 (худшее) до 5 (лучшее) с точки зрения общего впечатления. , чистота, точность, стоимость, общение, регистрация и местоположение. Как только хозяин набирает три отзыва, основная оценка отображается рядом с заголовком в результатах поиска и в самом листинге (см. Airbnb), что позволяет нам собирать данные. Суперхозяева должны иметь средний общий рейтинг 4,8 или выше в прошлом году, чтобы сохранить свой статус (см. Airbnb). Кроме того, источники утверждают, что если средний рейтинг учетной записи хозяина падает ниже 4,7, Airbnb начинает штрафовать хозяев (см. Статья), поэтому здесь не так много места для плохих результатов!

Неудивительно, что медиана каждой рейтинговой категории близка к 4,9, учитывая политику и структуру Airbnb. За исключением рейтинга «ценность» и «чистота», большинство категорий составляют 87% баллов от 4,8 до 5,0.

4️⃣Сборы. Большинство объявлений на Airbnb взимают с гостей плату за уборку в размере около 60–100 долларов США. Данные довольно нормально распределяются в этом диапазоне. Подробнее можно узнать здесь 🔗Плата за уборку.

5️⃣Спрос. Из-за своих временных характеристик спрос представляет собой сложную функцию. Наш подход заключался в том, чтобы извлечь доступные дни бронирования на следующие 30 дней и количество отзывов за последний год в качестве показателя спроса на данный момент времени.

Данные о вакансиях показывают почти равномерное распределение, что противоречит нашим ожиданиям, поскольку мы изучаем рынок STR в популярных областях. Подробнее можно узнать здесь 🔗NumReviews.

6.2) МНОГОМЕРНЫЙ АНАЛИЗ (МВА)

Многомерный анализ — это статистическая процедура, направленная на выявление зависимостей и закономерностей между переменными, сокращение и упрощение структуры сложных данных, а также сортировку или группировку тенденций. В то время как UVA предоставляет нам отдельные фрагменты информации о переменных в нашем наборе данных Airbnb, выполнение многомерного анализа помогает нам определить, как каждая переменная соотносится с ежедневными ценами, и выявить отношения между нашими входными переменными (мультиколлинеарность). Чтобы определить отношения между нашими переменными, мы начнем с создания корреляционных матриц для количественной оценки направления линейнойотношения между нашими числовыми переменными. Нелинейные закономерности и категориальные переменные будут изучаться с помощью различных подходов к визуальному анализу.

Как и ожидалось, переменная, связанная с пространством и рейтингом, показала очень высокие и статистически значимые коэффициенты корреляции, что поддержало наше первоначальное решение объединить их в кластеры. Высокая корреляция между суточной ставкой и платой за уборку (0,7) также не вызывает удивления, поскольку большие площади обычно приводят к более высоким ценам, что увеличивает стоимость уборки для хозяина. Однако вектор корреляции между рейтингами указывает на то, что на ежедневную ставку не влияет «Качество», которое было неожиданным. Существуют ли нелинейные одиночные или множественные тренды? Являются ли переменные сильно линейно коррелированными или они свободно распространяются в определенных, например, кластеры, связанные с местоположением? Можем ли мы распознать закономерности, когда интегрируем нечисловые переменные? Есть ли статистические выбросы в многомерном пространстве, которые влияют на наши результаты и должны быть удалены? Мы обсудим несколько визуальных подходов в следующем разделе.

1️⃣Местоположение. Как видно из приведенной ниже диаграммы, дневная цена объявлений Airbnb значительно различается среди 12 созданных нами кластеров. Кластеры, расположенные внутри суши, такие как Фресно или Сакраменто, показывают стандартное отклонение на 60% ниже, чем их прибрежные коллеги. В этих областях предсказательная сила нашей модели может быть более простой. Более подробную информацию и дополнительный анализ можно найти здесь 🔗mapCityPrices.

2️⃣Внешние особенности:

— Space: Точечные диаграммы (🔗priceSpace.linear) подтверждают то, что мы уже знаем из корреляционной матрицы. Попытка найти нелинейные паттерны с помощью нескольких трендовых инструментов не удалась, ни один из них не показал существенного улучшения линейной модели (🔗priceSpace.nonlinear). Мы предположили, что при увеличении размера собственности могут наблюдаться различные модели ценообразования. При расчете цены за гостя на рисунке ниже можно обнаружить нелинейную закономерность.

Оптимальный размер вместимости для Airbnbs, или сладкое пятно, кажется, составляет около двух гостей, прежде чем он упадет на 21% до уровня 45 долларов за гостя, от которого он продолжает снижаться по мере увеличения вместимости. Аналогичную закономерность можно обнаружить, если посмотреть на соотношение кроватей и спален (🔗priceBedratio). Мы утверждали, что объекты, в которых больше кроватей, чем спален, скорее всего, менее просторны и, следовательно, не могут оправдать тот же уровень цен, что и их аналоги с большим количеством спален.

— Тип. Детализация этих концепций путем включения типов комнат позволила получить больше информации. Оптимальный уровень цен на гостя зависит от типа номера и его местоположения (🔗priceSpaceLocation).

На уровне на одного гостя самые высокие цены устанавливаются за дома целиком при вместимости от 2 до 4 человек, в то время как гостиничные номера и частные комнаты достигают своего максимума при меньшей вместимости от 1 до 2 гостей. Не совсем чудо, учитывая бизнес-модель, стоящую за этими типами номеров. Airbnbs с подобными предложениями номеров рассчитаны на индивидуальных или деловых путешественников. Более подробную информацию и дополнительный анализ можно найти здесь (🔗priceSpaceRoom).

— Удобства. Набор данных об удобствах был в полном беспорядке. Около 75% данных были неполными, недоступными или поврежденными. Оставшийся набор данных достаточно велик для анализа, но его все же следует воспринимать с долей скептицизма из-за гетерогенных характеристик набора данных.

Большинство объектов, в которых были указаны удобства, могли взимать более высокую среднюю цену, чем объекты без них. Однако наш интерес в первую очередь заключался в доступности Интернета, потоковых сервисов и разрешении домашних животных. Несмотря на то, что эти факторы можно считать важными (🔗ценаAmenitiesSelect), в первую пятерку вошли наличие посудомоечной машины, балкона, кофеварки, камина и барбекю. Мы предполагаем наличие мультиколлинеарности по отношению к другим факторам, таким как категории Airbnb (например, особняк или таунхаус) или местоположение, но не располагаем данными для дальнейшего исследования.

3️⃣Качество.Точки на графике ниже отражают Общую оценку, представленную прошлыми гостями, в зависимости от уровня цен на соответствующем Airbnb. Неудивительно, что во всех рейтинговых категориях (🔗 priceRatingAll) он демонстрирует одинаковую закономерность. Airbnb с более высоким рейтингом, как правило, взимает более высокие цены. Вопрос, безусловно, заключается в причинно-следственной связи, стоящей за этим утверждением. Может ли хост взимать более высокие цены, если рейтинги достигают более высоких уровней? Мы повсеместно заметили, что суперхозяева, которые, вероятно, наиболее привержены своим инвестициям в Airbnb, имеют более высокие рейтинги (согласно требованиям Airbnb), но остаются на более низком уровне цен. Интересное понимание, если предположить, что их качественный опыт должен позволить им увеличить размер прибыли.

4️⃣Плата. Визуализация взаимосвязи между платой за уборку и ежедневными ставками подтверждает умеренно сильную положительную взаимосвязь, но также позволяет выявить несколько интересных самородков.

Диаграмма рассеяния показывает, что мы можем столкнуться с проблемами гетероскедастичности, когда начнем строить модели линейной регрессии в нашей следующей части. Кажется, что Airbnb с ценой выше 130 долларов менее последовательны, когда дело доходит до ценообразования платы за уборку. Емкость, как показатель пространства, похоже, не является единственным фактором очистки (🔗 cleaningCapacity). Некоторые хозяева склонны завышать или устанавливать плату за уборку ниже среднерыночной (даже нулевой). Учитывая недавние жалобы гостей на то, что хозяева берут слишком много денег — мы видели, как десятки хозяев берут плату за уборку в размере 600 долларов США за места с дневной оплатой в размере 480 долларов США — или просят своих гостей выполнить дополнительную уборку при выезде.

5️⃣Спрос. К сожалению, данные о спросе, которые мы собрали, оказались менее полезными, чем ожидалось. Позор, учитывая, что добавление «vacancyRates» к нашим алгоритмам сбора данных увеличило время выполнения в 4 раза.

Из приведенной выше гистограммы мы можем сделать вывод, что Airbnbs в более низком ценовом диапазоне (‹ 200 долларов США) составляют большую часть (75%) набора данных и что они, как правило, более забронированы, чем их более дорогие аналоги (🔗priceVacancy) . Но кроме этого ни vacancyRates (🔗 priceVacancyLinear), ни numReviews (🔗 priceNumReviewsLinear), популярный показатель спроса на статьи, похоже, не влияют на ценообразование.

7) Инсайты

В целом наш раздел исследовательского анализа и визуализации данных выявил несколько интересных идей о рынке краткосрочной аренды в Калифорнии с использованием набора данных Airbnb. На данный момент мы уже можем сделать несколько выводов о факторах и гипотезах, которые мы сформулировали в начале проекта:

📌Местоположение имеет значение. Цены на Airbnbs ближе к побережью в среднем на 10% выше, но вы также найдете очень популярные туристические места, такие как Напа или Палм-Спрингс, которые могут взимать вдвое большую рыночную цену. Расположение также влияет на другие функции, такие как вместимость. Недвижимость в палатках Лос-Анджелеса или Санта-Барбары должна иметь максимальную цену / количество гостей при более высоком уровне вместимости, чем во Фресно или Сакраменто.

📌Пространство положительно влияет на ценообразование. Чем больше площадь, тем выше общая стоимость аренды недвижимости. Однако стратегии, ориентированные на меньшую вместимость между 2–4 гостями, могут достичь более высоких уровней эффективности с точки зрения максимизации арендной ставки. Гостиничные номера и отдельные комнаты, как правило, рассчитаны на 1–2 гостей на объявление. Средний уровень цен на просторные объекты, как правило, выше. Например, Airbnbs с соотношением спальни к спальне 1:1 стоят на 20–25% дороже, чем Airbnbs с соотношением 3:1. Мы обнаружили, что посудомоечная машина, балкон, кофеварка, камин, принадлежности для барбекю и размещение с домашними животными оказывают заметное положительное влияние на ценообразование.

📌Качество опыта, измеряемое несколькими рейтинговыми категориями и статусом суперхозяина, похоже, не является основным фактором ценообразования. Рейтинги сильно искажены влево и показывают лишь небольшую дисперсию. Строгие рамки рейтинга Airbnb не позволяют сравнивать его с системой «звезд», которую мы знаем из гостиничной индустрии. Интересно, что суперхозяева, как правило, работают в нижней части ценового диапазона, который мы наблюдаем на рынке краткосрочной аренды в Калифорнии (50–150 долларов за ночь).

📌Плата за уборку, спорный второй источник дохода для хозяев, показывает устойчивые закономерности в нижнем ценовом диапазоне, но расходится после арендной ставки в 130 долларов США. После этого некоторые хосты, похоже, отказываются от относительного подхода к ценообразованию и начинают устанавливать цены выше (дополнительный доход) или ниже (уборка гостей?), чем рынок в целом.

📌Спрос: большое разочарование этого исследования. Выбранный нами прокси, количество отзывов и будущих 30-дневных бронирований, похоже, не влияли на уровни цен линейным или нелинейным образом. Мы считаем, что экономическая причина этой переменной и наша гипотеза верны, и призываем будущие исследования рассмотреть альтернативные меры.

8) Ограничения

⚠️Исторические данные не могут быть включены в это исследование из-за ограниченного доступа к данным. Следовательно, это аналитическое исследование не может учитывать сезонность или сравнивать текущий экономический режим с прошлыми режимами, такими как до пандемии COVID-19.

⚠️В летнем релизе 2022 года Airbnb представила 55 новых категорий, в которых дома распределяются по стилю, местоположению или близости к туристическим местам (например, на берегу озера, домике на дереве или маленьком доме). К сожалению, несколько протестированных нами библиотек парсеров не смогли воспользоваться этой новой функцией, которая, по нашему мнению, может оказать существенное влияние на ценообразование и должна быть включена в будущие исследования.

⚠️Мы предполагаем, что наша случайная выборка объектов Airbnb репрезентативна для всего населения и что рынок краткосрочной аренды в Калифорнии можно охарактеризовать как минимум полуэффективный.

9) Заключительные замечания и следующие шаги

Первый важный этап завершен. Мы сформулировали четкие цели и гипотезы, распределили обязанности между членами команды, собрали, очистили и структурировали наши наборы данных. Исследовательский анализ данных позволил нам оценить большую часть нашей гипотезы и открыл нам дополнительные идеи. Например, мы могли бы разделить набор данных на разные подмножества, соответствующие различным линейным тенденциям, которые мы обнаружили при анализе переменных местоположения и пространства.

Однако поиск и количественная оценка закономерностей в многомерном наборе данных с помощью методов визуализации очень сложны и не позволяют интуитивно выявить и проиллюстрировать линейные отношения, особенно когда задействовано более трех переменных. Применение и выбор моделей предиктивной аналитики является важным следующим шагом для улучшения нашего понимания многомерных характеристик, атрибутов и зависимостей.

В следующей части мы создадим модели машинного обучения, чтобы найти в наборе данных наиболее важные функции, влияющие на структуру ценообразования Airbnbs, и предоставим инструменты для оцените ежедневные ставки на Airbnbs.