Введение:

Бизнес-проблема:

Розничная компания хочет открыть супермаркет в городе Хайдарабад, но не совсем уверена в том, в каком районе (ах) открыть магазин (ы). В идеале в выбранных местах должно быть значительное население, чтобы было больше посетителей магазинов и поблизости в рабочие центры / жилые районы для облегчения доступа большого количества граждан.

Необходимо ответить на 2 бизнес-вопроса.

1. В каком районе (районе) города компания должна открывать супермаркет в первую очередь.

2. Какие районы были бы идеальными в той части (как в пункте 1) создания такого супермаркета в городе.

В идеале компания предпочла бы открывать магазины в районах, где цены на недвижимость сравнительно ниже (не совсем низкие). Но в то же время они хотят выбирать районы с большим населением и большим количеством заведений, поскольку это должно привести к увеличению посещаемости магазина. Когда мы рассматриваем бизнес-проблему, мы можем создать карту и информационную диаграмму, где цены на недвижимость указаны в Хайдарабаде, и каждая область сгруппирована в соответствии с плотностью проведения мероприятий.

Задний план:

Я выбрал Хайдарабад для своего проекта, так как я знаком с ним, будучи жителем города. Район Хайдарабад - это мегаполис с населением около 5 миллионов человек и 150 округов (GHMC). Город отличается высокой плотностью населения и плотностью населения. Перенаселенность приводит к тому, что владельцы магазинов и мест для общения в густонаселенных городах становятся все более популярными. Такая кластеризация гарантирует, что районы с умеренной ценой на недвижимость и большим количеством площадок будут объединены в один кластер и, следовательно, будут использоваться для решения бизнес-задач.

Описание данных:

Для решения бизнес-проблемы я решил использовать следующие данные, перечисленные ниже, включая API данных Foursquare Location.

Данные о географических координатах районов в городе Хайдарабад по почтовому индексу из репозитория GitHub.

Источник: https://github.com/sanand0/pincode/blob/master/data/IN.csv

Данные о местах проведения для каждого района города с использованием Foursquare API. Я включил места в радиусе 1000 метров от каждого района.

Эти данные помогают нам идентифицировать похожие районы с использованием мест, а также помогают в алгоритме кластеризации.

Данные Geo-Json для GHMC (муниципалитет Хайдарабада) для карт Choropleth (для отображения цен на недвижимость).

Использовать:

Нанесение окрестностей на карту Folium. Создание центров для каждого района с использованием географических координат.

Эти данные помогают нам отображать цены на недвижимость на картах Choropleth / Folium Maps.

Средние цены на жилье (за квадратный фут) для каждого района в городе Хайдарабад.

Источник: https://www.makaan.com/price-trends/property-rates-for-buy-in-hyderabad

Использовать:

Эти данные помогают нам отображать цены на недвижимость на картах Choropleth Maps и определять потенциальные районы, где можно открыть магазины.

Методология

Что касается цен на жилье, я использовал веб-скрапинг для извлечения данных с веб-сайта поиска домов в моем проекте. Часть таблицы, представленной ниже.

Я использовал библиотеку python folium для визуализации географических деталей Хайдарабада, создав карту Хайдарабада с наложенными на нее окрестностями. Я использовал значения широты и долготы, чтобы получить визуальное представление, как показано ниже:

Используя данные Хайдарабадского района Geojson (с граничными координатами для районов), я вычислил центральные координаты для каждого района, используя код Python и понимание списка. Затем я использовал Folium Library для визуализации центров на карте.

Ниже приведено изображение карты, на котором показаны все районы (синим цветом) и их центры (красные точки).

Я использовал Foursquare API, чтобы исследовать районы и сегментировать их. Я сохранил ограничение в 100 мест и радиус 1000 метров для каждого районного центра (рассчитанного выше) на основе заданных данных о широте и долготе. Вот заголовок списка, информация о названии, категории, широте и долготе мест из Foursquare API.

Обобщая эти данные, Foursquare для районов Хайдарабада вернул около 1400 мест.

Мы видим, что в Кондапуре, Сомаджигуда, Джубили-Хиллз и Банджара-Хиллс больше всего развлекательных заведений, и все они расположены в западной / западно-центральной части Хайдарабада.

Кроме того, Foursquare вернул 99 уникальных категорий мест проведения (для западных районов Хайдарабада). Ниже представлены 10 самых популярных категорий заведений.

Я создал таблицу, в которой показан список из 10 самых распространенных категорий мест для каждого района. Часть того же показана ниже.

Поскольку у нас есть несколько общих категорий мест в Окрестности, я использовал алгоритм неконтролируемого обучения K-средних для кластеризации Окрестностей. Алгоритм K-средних - один из наиболее распространенных методов кластеризации для обучения без учителя. Я использовал K-Means с методом локтя, чтобы найти оптимальное значение k, равное 5, для кластеризации.

Ниже представлена ​​объединенная таблица с метками кластера для каждого района.

Мы также можем проверить эту частоту средних цен продажи жилья в разных районах, используя график гистограммы.

Результаты

Анализ показывает, что, хотя в Хайдарабаде имеется большое количество заведений (~ 1400 мест для 145 районов), они сосредоточены в западных и западно-центральных районах.

Я рассмотрел только западную часть Хайдарабада (13 районов, о которых говорилось выше) для кластеризации, поскольку они густонаселенны и средние цены на жилье также высоки, что указывает на сравнительно высокий доход жителей. Также в западной части Хайдарабада есть большое количество рабочих центров и офисов (районы Гачибоули / Кондапур).

Некоторые моменты:

  • В Somajiguda, Banjara Hills есть множество супермаркетов, мини-маркетов и универмагов.
  • Кондапур, Джубили-Хиллз и Колония Венкатешвара (которая является продолжением холмов Банджара) также имеют большое количество заведений и большое население.

Что касается бизнес-проблемы, обсуждаемой в разделе «Введение», мы можем порекомендовать следующие ответы:

  1. Западная часть Хайдарабада подойдет для открытия супермаркета / гипермаркета по причинам, описанным выше.
  2. В западной части можно порекомендовать открыть супермаркеты в таких районах, как Джубили-Хиллз / Банджара-Хиллз, Сомаджигуда и Кондапур. Вы также можете увидеть кластерную карту западных кварталов Хайдарабада ниже.

Карта окрестностей на западе Хайдарабада с кластерами показана ниже.

В сводном разделе одной из моих целей было также визуализировать средние цены за квадратный фут с помощью карты в стиле хороплет. В последнем разделе я создал карту картограмм, на которой также есть следующая информация для каждого района:

  1. Название кластера
  2. Цена продажи жилья (Avg_Price) как Choropleth,

Вывод

Целью этого проекта было выявление окрестностей Хайдарабада, близких к центру, с небольшим количеством ресторанов, чтобы помочь заинтересованным сторонам сузить круг поиска оптимального места для создания супермаркета. Кластеризация окрестностей в западном Хайдарабаде была проведена с целью создания основных зон интереса, которые будут использоваться в качестве отправных точек для окончательного исследования заинтересованными сторонами.

Рекомендуемые районы следует рассматривать только как отправную точку для более подробного анализа, который в конечном итоге может привести к определению местоположения, в котором будут учтены другие факторы и выполнены все другие соответствующие условия.

Окончательное решение о расположении ресторана в супермаркете будет приниматься заинтересованными сторонами на основе конкретных характеристик районов и местоположений в каждой рекомендованной зоне, с учетом дополнительных факторов, таких как привлекательность каждого местоположения (близость к населению / рабочим центрам и рынкам), близость к основным дорогам, цены на недвижимость, социально-экономическая динамика каждого квартала и т. д.

Спасибо за чтение!

Вы можете найти код по этой Github Link.