Пример использования науки о данных в малом и среднем бизнесе

В нашем современном цифровом мире данные повсюду.

Но то, что данные повсюду, не означает, что данные доступны везде. Наоборот, на самом деле. Большая часть данных, генерируемых цифровыми продуктами, бесполезна, потому что данные не предназначены для изучения, а скорее используются для поддержки производительности цифрового продукта.

В результате данные хранятся в пределах архитектуры, используемой для поддержки цифрового приложения. Следовательно, данные кодируются способами, полезными для приложения, и хранятся в «стенах» этого приложения. Другими словами, данные разрознены.

Давайте рассмотрим очень простой пример с точки зрения малого бизнеса. Для большинства малых предприятий наиболее важными данными, которые они собирают, являются финансовые отчеты. И для многих из этих же предприятий предпочтительным приложением для управления этими финансовыми записями является QuickBooks.

Теперь предположим, что у бизнеса было два продукта: продукт А и продукт Б. Продукт А — это небольшой продукт, который дешевле и удовлетворяет более распространенную потребность своих потребителей. Продукт B, с другой стороны, является более крупным продуктом, более дорогим (и более прибыльным), но представляет собой более нишевый рынок, чем продукт A.

Теперь предположим, что бизнес хочет знать, какой процент клиентов, купивших продукт А, также купил продукт Б.

Использование данных в QuickBooks было бы лучшим началом для ответа на этот вопрос, однако данные сохраняются на серверах QuickBooks и поэтому недоступны для механизма аналитики. Более того, если бы бизнес также хотел знать, каковы характеристики клиентов, купивших продукты A и B, им, вероятно, потребовался бы отдельный источник данных, что-то вроде данных из приложения для управления взаимоотношениями с клиентами (CRM).

Этот простой сценарий поднимает множество проблем, связанных с хранилищами данных. Во-первых, поскольку данные разрознены в каждом приложении, нет очевидного способа объединить их. Во-вторых, поскольку данные закодированы для обслуживания приложения, их формат не позволяет ответить на подобные вопросы.

Введите, наука о данных.

Именно здесь на помощь приходит наука о данных, которая может помочь решить каждую из этих проблем с помощью разработки признаков. Как минимум данные могут быть загружены из каждого приложения. После загрузки специалист по данным может заняться перекодированием и переформатированием данных, чтобы их можно было объединить. После объединения и реинжиниринга данные можно использовать для ответа на простые вопросы, например, какой процент клиентов купил продукты A и B. Это упражнение также открывает новые возможности, такие как понимание того, какие характеристики отличались у клиентов, которые купили оба продукта, когда по сравнению с теми клиентами, которые купили только продукт А.

В конечном счете, специалист по данным может использовать данные для построения прогностической модели, которая может предсказать вероятность того, что кто-то купит продукт B, когда у нас есть данные от них только по продукту A.

Хотите узнать о науке о данных, карьерном росте, жизни или неправильных бизнес-решениях? Подпишитесь на мою рассылку здесь и получите ссылку на мою бесплатную электронную книгу.