Откройте индийский ресторан на Манхэттене, Нью-Йорк.

  1. Введение:

Цель этого проекта — найти наиболее перспективное место для открытия аутентичного индийского ресторана на Манхэттене, Нью-Йорк.

В Нью-Йорке проживает более 3,2 миллиона жителей, родившихся за пределами США. В Нью-Йорке проживает около 315 000 человек с Индийского субконтинента.

Это разнообразие в культуре также влияет на разнообразие пищи. Вы найдете китайские, тайские, итальянские, индийские рестораны по всему Нью-Йорку.

2. Методология

Мы сегментируем все районы Манхэттена по типам заведений, присутствующих в каждом районе. Например, если мы возьмем два района Вашингтон-Хайтс и Манхэттен-Вилль, наиболее распространенными местами проведения мероприятий в этих районах являются кафе, книжные магазины и спортивные залы, поэтому они могут попасть в один и тот же кластер.

Итак, мы находим кластер с максимальным количеством индийских ресторанов, и идея состоит в том, что если индийские рестораны хорошо работают в большинстве районов этого кластера, то они будут прибыльными в других районах (в которых нет ни одного индийского ресторана) этого кластера. .

3. Раздел данных

3.1 Список районов Манхэттена

  • Источник данных, который содержит список районов для каждого района — https://cocl.us/new_york_dataset
  • Извлечем все кварталы с районом Манхэттен

  • После извлечения названий районов и координат местоположений мы преобразуем их во фрейм данных.

3.2 Список площадок в каждом районе

  • Источник данных — API Foursquare
  • С помощью Foursquare API мы получаем JSON-файл, содержащий список всех площадок и описание площадок для всех районов.

4. Обработка данных

4.1 Извлеките все районы и их расположение на Манхэттене из файла nyu_geojson.json и преобразуйте его во фрейм данных.

Синие точки обозначают все районы Манхэттена.

4.2 Получить список площадок и информацию о них с помощью Foursquare

URL-адрес для получения информации обо всех окрестностях площадок

url = 'https://api.foursquare.com/v2/venues/explore?&client_id={}&client_secret={}&v={}&ll={},{}&radius={}&limit={}.format »

Я написал функции для извлечения названия места проведения, местоположения места проведения и категорий мест проведения, чтобы получить следующий фрейм данных.

5. ЭДА

5.1 Быстрое кодирование категорий мест проведения

5.2 Manhattan_grouped

  • Затем мы группируем строки по соседству и, взяв среднее значение частоты появления каждой категории

Данные Manhattan_grouped будут использоваться в дальнейшем для группировки районов в кластеры на основе похожих мест.

5.3 Районы Манхэттена + среднее значение частоты индийских ресторанов в этом районе

5.4 Наиболее распространенные заведения в каждом районе

  • Мы сортируем каждую строку в Манхэттене по группам и получаем 10 лучших категорий для каждого района.

6. Кластеризация

  • Мы разделяем районы на кластеры на основе наиболее распространенных мест в каждом районе.

  • Все окрестности под меткой кластера 0 отмечены красным, 1 отмечены фиолетовым, 2 отмечены синим, 3 отмечены зеленым и 4 отмечены красным, оранжевым.

7. Анализ кластеров

  • Индийские рестораны по кластерам

  • Кластер 0

кластер 2

  • Кластер 4

8. Обсуждение

  • Мы сгруппировали районы на основе мест проведения в каждом районе. Например, если мы возьмем два района из кластера 2 Вашингтон-Хайтс и Манхэттен-Вилль, люди в обоих этих районах пользуются кафе, книжными магазинами и тренажерными залами, поскольку это наиболее распространенные места в городе. оба этих района.
  • На рис. 1 мы видим, что кластеры с максимальным количеством индийских ресторанов находятся в кластерах 0, кластере 2 и кластере 4.
  • Для кластеров 0 и 2 в большинстве районов есть рестораны индийской кухни, если мы откроем рестораны в районах из этих кластеров, наиболее вероятно, что они будут прибыльными.
  • Из рис. 23 видно, что в четвертом кластере 18 районов, но только в 8 районах есть рестораны индийской кухни, а это даже не половина, поэтому мы не можем быть уверены, что открывать рестораны в районах из кластера 4 будет выгодно.

9. заключение

  • Мы откроем наш ресторан в районах, где нет индийских ресторанов, но которые входят в кластер 0 или кластер 2.
  • Если мы открываемся в кластере 0 — Инвуд, Восточный Гарлем, Тюдор-сити
  • Если мы открываемся в кластере 2 - Клинтон, южный центр города, Хадсон-Ярдс.

вы можете зайти и проверить мой проект на https://github.com/ishasahni2000/Battle-of-Neighborhoods