Введение:

Целью этого проекта является объединение Нью-Йорка в 4 кластера по ценам на пиццерии.

Целевые люди — это люди, которые любят пиццу и хотят посетить Нью-Йорк и остановиться в районе, где цены на пиццу соответствуют его/ее доходу.

Другой способ выразить это:

Человек X хочет посетить город своей мечты. Нью-Йорк,

X любит пиццу,

Х хочет остаться в районе, где цены на пиццу соответствуют его доходам.

Данные:

прежде всего вам нужно знать, что Foursquare предоставляет для каждого дохода «ценник» от 1 до 4, где 1 — самый дешевый, а 4 — самый дорогой.

данные будут собираться следующим образом:

для каждого района в Нью-Йорке я буду искать в районе 1000 метров места с ценами 1, 2, 3, 4 и посчитаю их, чтобы получить количество мест с «ценой тега 1» в районе и количество мест с « тег 2 цена» по соседству и так далее…

окончательные данные будут представлять собой фрейм данных с 306 строками (количество районов Нью-Йорка)

в каждой строке указано количество пиццерий с тегом 1->4 цена.

Не существует такой вещи, как район с низкими ценами или район с высокими ценами.

В каждом районе есть места с 1-4 ценниками, но их количество варьируется от района к району,

Поэтому для каждого района я буду использовать количество мест каждого ценника, как показано ниже, в качестве входного вектора для модели KMeans (после нормализации), и это сгруппирует районы примерно так:

«скорее всего, у них есть дешевые места» или

“скорее всего, есть дорогие места”

Результаты:

4 кластера от самых дорогих до самых дешевых

Желтый -> Зеленый -> Синий -> Красный

Как мы заметили выше, самые дорогие районы находятся на Манхэттене.

Обсуждение:

Ниже приведено изображение цен на дома за квадратный фут, мы замечаем очевидную связь между ценами на дома и ценами на пиццу в одном и том же районе.

Даже в одном и том же районе мы наблюдаем влияние цен на дома на цены на пиццу.

Обратите внимание, что северо-запад Манхэттена является самым дорогим по ценам на дома и столько же по ценам на пиццу.

Вывод:

Как мы видели выше, если вы платите высокую арендную плату, вы, скорее всего, будете платить больше за пиццу, поэтому цена пиццы, скорее всего, будет соответствовать вашей арендной плате, например, если вы живете в районе с низкой арендной платой, вы, скорее всего, заплатите меньше за свою пиццу.

Еще один вывод. Манхэттен — самый дорогой район Нью-Йорка, где можно купить пиццу.

Ресурсы:



https://www.trulia.com/research/rent-control-sf-nyc/



ссылка на проект:

https://github.com/tareqalbeesh/Clustering-NYC-neighborhoods-by-pizza-places-prices