Введение:
Бизнес-проблема:
Розничная компания хочет открыть супермаркет в городе Хайдарабад, но не совсем уверена в том, в каком районе (ах) открыть магазин (ы). В идеале в выбранных местах должно быть значительное население, чтобы было больше посетителей магазинов и поблизости в рабочие центры / жилые районы для облегчения доступа большого количества граждан.
Необходимо ответить на 2 бизнес-вопроса.
1. В каком районе (районе) города компания должна открывать супермаркет в первую очередь.
2. Какие районы были бы идеальными в той части (как в пункте 1) создания такого супермаркета в городе.
В идеале компания предпочла бы открывать магазины в районах, где цены на недвижимость сравнительно ниже (не совсем низкие). Но в то же время они хотят выбирать районы с большим населением и большим количеством заведений, поскольку это должно привести к увеличению посещаемости магазина. Когда мы рассматриваем бизнес-проблему, мы можем создать карту и информационную диаграмму, где цены на недвижимость указаны в Хайдарабаде, и каждая область сгруппирована в соответствии с плотностью проведения мероприятий.
Задний план:
Я выбрал Хайдарабад для своего проекта, так как я знаком с ним, будучи жителем города. Район Хайдарабад - это мегаполис с населением около 5 миллионов человек и 150 округов (GHMC). Город отличается высокой плотностью населения и плотностью населения. Перенаселенность приводит к тому, что владельцы магазинов и мест для общения в густонаселенных городах становятся все более популярными. Такая кластеризация гарантирует, что районы с умеренной ценой на недвижимость и большим количеством площадок будут объединены в один кластер и, следовательно, будут использоваться для решения бизнес-задач.
Описание данных:
Для решения бизнес-проблемы я решил использовать следующие данные, перечисленные ниже, включая API данных Foursquare Location.
Данные о географических координатах районов в городе Хайдарабад по почтовому индексу из репозитория GitHub.
Источник: https://github.com/sanand0/pincode/blob/master/data/IN.csv
Данные о местах проведения для каждого района города с использованием Foursquare API. Я включил места в радиусе 1000 метров от каждого района.
Эти данные помогают нам идентифицировать похожие районы с использованием мест, а также помогают в алгоритме кластеризации.
Данные Geo-Json для GHMC (муниципалитет Хайдарабада) для карт Choropleth (для отображения цен на недвижимость).
Использовать:
Нанесение окрестностей на карту Folium. Создание центров для каждого района с использованием географических координат.
Эти данные помогают нам отображать цены на недвижимость на картах Choropleth / Folium Maps.
Средние цены на жилье (за квадратный фут) для каждого района в городе Хайдарабад.
Источник: https://www.makaan.com/price-trends/property-rates-for-buy-in-hyderabad
Использовать:
Эти данные помогают нам отображать цены на недвижимость на картах Choropleth Maps и определять потенциальные районы, где можно открыть магазины.
Методология
Что касается цен на жилье, я использовал веб-скрапинг для извлечения данных с веб-сайта поиска домов в моем проекте. Часть таблицы, представленной ниже.
Я использовал библиотеку python folium для визуализации географических деталей Хайдарабада, создав карту Хайдарабада с наложенными на нее окрестностями. Я использовал значения широты и долготы, чтобы получить визуальное представление, как показано ниже:
Используя данные Хайдарабадского района Geojson (с граничными координатами для районов), я вычислил центральные координаты для каждого района, используя код Python и понимание списка. Затем я использовал Folium Library для визуализации центров на карте.
Ниже приведено изображение карты, на котором показаны все районы (синим цветом) и их центры (красные точки).
Я использовал Foursquare API, чтобы исследовать районы и сегментировать их. Я сохранил ограничение в 100 мест и радиус 1000 метров для каждого районного центра (рассчитанного выше) на основе заданных данных о широте и долготе. Вот заголовок списка, информация о названии, категории, широте и долготе мест из Foursquare API.
Обобщая эти данные, Foursquare для районов Хайдарабада вернул около 1400 мест.
Мы видим, что в Кондапуре, Сомаджигуда, Джубили-Хиллз и Банджара-Хиллс больше всего развлекательных заведений, и все они расположены в западной / западно-центральной части Хайдарабада.
Кроме того, Foursquare вернул 99 уникальных категорий мест проведения (для западных районов Хайдарабада). Ниже представлены 10 самых популярных категорий заведений.
Я создал таблицу, в которой показан список из 10 самых распространенных категорий мест для каждого района. Часть того же показана ниже.
Поскольку у нас есть несколько общих категорий мест в Окрестности, я использовал алгоритм неконтролируемого обучения K-средних для кластеризации Окрестностей. Алгоритм K-средних - один из наиболее распространенных методов кластеризации для обучения без учителя. Я использовал K-Means с методом локтя, чтобы найти оптимальное значение k, равное 5, для кластеризации.
Ниже представлена объединенная таблица с метками кластера для каждого района.
Мы также можем проверить эту частоту средних цен продажи жилья в разных районах, используя график гистограммы.
Результаты
Анализ показывает, что, хотя в Хайдарабаде имеется большое количество заведений (~ 1400 мест для 145 районов), они сосредоточены в западных и западно-центральных районах.
Я рассмотрел только западную часть Хайдарабада (13 районов, о которых говорилось выше) для кластеризации, поскольку они густонаселенны и средние цены на жилье также высоки, что указывает на сравнительно высокий доход жителей. Также в западной части Хайдарабада есть большое количество рабочих центров и офисов (районы Гачибоули / Кондапур).
Некоторые моменты:
- В Somajiguda, Banjara Hills есть множество супермаркетов, мини-маркетов и универмагов.
- Кондапур, Джубили-Хиллз и Колония Венкатешвара (которая является продолжением холмов Банджара) также имеют большое количество заведений и большое население.
Что касается бизнес-проблемы, обсуждаемой в разделе «Введение», мы можем порекомендовать следующие ответы:
- Западная часть Хайдарабада подойдет для открытия супермаркета / гипермаркета по причинам, описанным выше.
- В западной части можно порекомендовать открыть супермаркеты в таких районах, как Джубили-Хиллз / Банджара-Хиллз, Сомаджигуда и Кондапур. Вы также можете увидеть кластерную карту западных кварталов Хайдарабада ниже.
Карта окрестностей на западе Хайдарабада с кластерами показана ниже.
В сводном разделе одной из моих целей было также визуализировать средние цены за квадратный фут с помощью карты в стиле хороплет. В последнем разделе я создал карту картограмм, на которой также есть следующая информация для каждого района:
- Название кластера
- Цена продажи жилья (Avg_Price) как Choropleth,
Вывод
Целью этого проекта было выявление окрестностей Хайдарабада, близких к центру, с небольшим количеством ресторанов, чтобы помочь заинтересованным сторонам сузить круг поиска оптимального места для создания супермаркета. Кластеризация окрестностей в западном Хайдарабаде была проведена с целью создания основных зон интереса, которые будут использоваться в качестве отправных точек для окончательного исследования заинтересованными сторонами.
Рекомендуемые районы следует рассматривать только как отправную точку для более подробного анализа, который в конечном итоге может привести к определению местоположения, в котором будут учтены другие факторы и выполнены все другие соответствующие условия.
Окончательное решение о расположении ресторана в супермаркете будет приниматься заинтересованными сторонами на основе конкретных характеристик районов и местоположений в каждой рекомендованной зоне, с учетом дополнительных факторов, таких как привлекательность каждого местоположения (близость к населению / рабочим центрам и рынкам), близость к основным дорогам, цены на недвижимость, социально-экономическая динамика каждого квартала и т. д.
Спасибо за чтение!
Вы можете найти код по этой Github Link.