Хотите купить свою первую квартиру в Сингапуре?

В этом посте мы рассмотрим визуализацию цен продажи перепродажи HDB и квартир для продажи в Сингапуре. Данные публично получены с онлайн-портала недвижимости 99.co. (данные верны на 13 февраля 2021 г.)

После очистки полученных данных наш набор данных содержит следующее:

Общее количество объявлений о продаже квартир HDB: 9412

Столбцы содержат:
Название (название листинга)
Район (Почтовый район)
Цена продажи (цена предложения для листинга)
Цена за квадратный фут (Цена за квадратный фут)
Количество спальных мест (Количество спален в HDB, 1–5 спален)

Выполнение некоторой описательной статистики по набору данных, и вот полученные значения:

(Все доллары выражены в сингапурских долларах $SGD)

Общее количество продаж = 9412
Минимальная цена продажи = 210 000,0 долларов США
Максимальная цена продажи = 2 074 000,0 долларов США
Средняя цена продажи = 595 002,28 долларов США
Средняя цена продажи = 575 000,0 долларов США
Самая высокая Частота появления Цена продажи листинга = 650 000 долларов США
Асимметрия цены продажи листинга = 0,88

Асимметрия 0,88 ближе к значению 1, что указывает на то, что цены продажи в Листинге смещены вправо.

Подробная информация о минимальных и максимальных ценах продажи:

10 самых продаваемых объявлений по району и количеству показов:

Мы видим, что большинство объявлений о продаже относятся к этим трем районам:

  • District 19 North East — HDB расположены в Хуганге, Пунгголе, Сенканге.
  • Район 3, северо-восток — HDB расположен по адресу Alexandra Road, Tiong Bahru, Queenstown.
  • Район 18 Дальний Восток — HDB расположены в Пасир-Рис, Симей, Тампинс

10 самых продаваемых объявлений по цене продажи и частоте показов:

Визуализация частотного распределения количества спален в списках продаж HDB:

1 спальня

2 спальни

3 спальни

4 спальни

5 спален

Совмещенный (1–5 спален)

Основываясь на приведенном выше распределении частот, мы видим, что большая часть запрашиваемой цены для всех списков продаж в нашем наборе данных, как правило, имеет среднюю цену продажи примерно от 500 000 до 600 000 долларов. Большинство предложений состоят в основном из 3-х комнатных квартир.

Частотное распределение количества комнат, выставленных на продажу, по районам:

Другое частотное распределение позволяет нам увидеть, что большинство выставленных на продажу квартир с 3 спальнями, как правило, принадлежат району 19 (Хуган, Пунггол, Сенгкан) затем следует район 3 (Александра Роуд, Тионг Бару, Квинстаун)и район 18 (Пасир Рис, Симей, Тампинс)

Графика запрашиваемой цены для объявлений:

Наконец, мы попытаемся построить некоторые прогностические модели с набором данных, чтобы предсказать цену продажи для будущих листингов. Мы будем экспериментировать с моделью множественной линейной регрессии и моделью дерева решений (регрессии).

Множественная линейная регрессия

Наши наборы для тестирования и обучения будут состоять из разделения 20/80%.

Наконец, наше уравнение регрессионной модели для прогнозирования цены продажи листинга HDB:

Прогнозируемое значение = 279191,81 - 10499,11(Район) + 107,61(Цена за квадратный фут) + 141381,57(Количество спальных мест)

Наша модель имеет среднеквадратичную ошибку 150062,24, которую можно использовать при сравнении с нашей моделью дерева решений позже. (Чем меньше, тем лучше) Кроме того, при коэффициенте детерминации квадрата R, равном 0,39, независимые переменные предсказывают 39% зависимой переменной (целевой). (Где ближе к 1,0 представляет собой идеальное соответствие)

Мы видим, что наша модель, похоже, переоценивает цену продажи на основе значений нашего набора данных, например, используя переменные для прогнозирования цены продажи строки 0.

Предполагаемый результат:

Фактические результаты:

Дополнительные фактические и прогнозируемые результаты:

Дерево решений для регрессии

Далее мы поэкспериментируем с деревом решений для регрессионной модели, используя процент тестирования продаж и обучения, и сравним его с нашей предыдущей моделью.

И метрики нашей модели дерева решений:

По сравнению с нашей предыдущей моделью модель дерева решений имеет меньшую среднеквадратичную ошибку: 101465,99 против 150062,24.

Дополнительные фактические и прогнозируемые результаты:

Мы по-прежнему видим, что модель переоценивает и недооценивает несколько строк.

Наконец, прогностические модели по-прежнему требуют дальнейшей тонкой настройки для предсказания будущего и используются только в целях объяснения. Я надеюсь, что вы получили интересные сведения об анализе квартир HDB для продажи в Сингапуре.

Любознательный ученик? Раскройте весь потенциал своего обучения на носителе и поддержите таких писателей, как я, менее чем за чашку кофе.