Мы в Nearby Technologies твердо верим в методологию, основанную на данных, прежде чем принимать какие-либо бизнес-решения, и теперь это встроено в нашу ДНК, чтобы «тестировать-измерять-внедрять» все и вся!

Мы являемся одним из первых лидеров финтеха, у которого есть собственная команда по науке о данных, которая позволяет бизнесу принимать решения на ходу с помощью вспомогательных данных и интеллектуальных идей.

Спасибо нашей собственной команде опытных ученых и аналитиков данных, которые достигают наших сложных целей по поддержанию работоспособности всей системы 24 часа в сутки 7 дней в неделю.

Данные имеют решающее значение, и для принятия высокоэффективных решений мы в Nearby tech начали собирать огромное количество данных из разных источников, но для того, чтобы собрать все в одном месте, нужна была команда, которая могла бы извлечь из данных ценность. Именно тогда появилась команда Data Science. Два года назад мы начали этот путь, и сегодня мы помогаем бизнесу использовать эти данные в принятии решений, отслеживании KPI, маркетинге и продажах.

Текущая система

Источник:

В разных системах ~200 источников данных!

Таким образом, мы можем представить себе задачу собрать все данные в одном месте и создать единый источник записей, что является лишь первым шагом к созданию полноценного стека обработки данных.

Конвейеры ETL:

В Nearby мы принимаем ~ 200 миллионов транзакционных записей в месяц с более чем 200 активными конвейерами!

Безопасность данных лежит в основе технологий Nearby, и это одна из причин, по которой мы создали нашу ETL-платформу на GCP. Это не только помогло нам защитить данные, но и помогло нам сэкономить деньги, которые могли бы быть огромными, если бы мы выбрали какой-либо сторонний инструмент ETL.

Хранилище данных и озеро данных:

Мы используем два типа хранилищ данных для решения различных задач.

  1. Google BigQuery — это инструмент хранилища данных со столбцами, основанный на модели оплаты за сканирование.
  2. Облачное хранилище — здесь мы храним холодные данные и часто очищаем их.

Ниже перечислены некоторые общие рекомендации, которые следует учитывать при настройке и использовании Bigquery.

  • Избегайте использования вместо этого Select *, укажите нужный столбец. Этот метод поможет вам значительно сократить расходы.
  • Используйте кластерный метод разделения данных при хранении данных, это помогает снизить стоимость запроса, даже если вам нужно сканировать самую тяжелую таблицу.
  • Храните холодные данные в отдельной таблице, так как активные и холодные данные оцениваются по-разному в GCP.

Визуализация данных, информационные панели и отчетность:

Мы используем PowerBI для создания информационных панелей, визуализации и создания отчетов. Это универсальный источник всех показателей продукта и бизнеса, который широко используется в организации для отслеживания производительности продукта и состояния бизнеса. Это позволяет старшему руководству и CXO быть в курсе всех ключевых показателей, а также дает им пользовательский интерфейс, откуда на основе фильтров они могут извлекать метаданные.

Мы также используем Automailers для отправки многих отчетов прямо в почтовый ящик заинтересованных лиц с помощью R/python.

BigQuery — это единый источник для всех потребностей бизнес-пользователей в доступе к данным, единственное необходимое условие — базовые знания SQL.

Машинное обучение:

У нас есть специальная команда специалистов по данным, которые вместе работают над созданием надежных систем, которые помогают легко достигать наших бизнес-целей.

Вот несколько систем, созданных нашими специалистами по данным:

  • Система перекрестных продаж продуктов основана на использовании продукта, местоположении и роде деятельности.
  • PAN и Adhaar OCR с использованием Google Vision и уровня машинного обучения — с помощью этой системы мы смогли считывать данные непосредственно с изображения, тем самым уменьшая количество человеческих ошибок.
  • Модель прогнозирования оттока: мы смогли предсказать, кто покинет систему в течение следующих 15 дней, тем самым заблаговременно разработав стратегию удержания, которая, в свою очередь, помогла нам достичь ~85%–90% секунд. -месяц удержания агентов
  • Оптимизация цен
  • Оценка рынка с использованием многоуровневой модели машинного обучения, которая помогла нам понять новую область, в которой может быть создан рынок, что помогло бизнесу разработать стратегию своих функций продаж.
  • Геймификация продаж. Что такое геймификация для неигровой индустрии?

"Использование характерных игровых элементов в обычно неигровых контекстах для создания игрового опыта, повышающего ценность пользователей"

Это именно то, что мы сделали и создали игровой процесс для наших клиентов, который, в свою очередь, повысит вовлеченность пользователей. Мы назвали его «Таблица лидеров». Это платформа, на которой мы позволяем нашим клиентам зарабатывать больше, и платформа, которая дает им прилив адреналина, чтобы занять первое место в регионе, прививая им чувство соперничества.

Бизнес-аналитика:

«Один размер подходит всем» — это то, что не применимо ни к одной команде по науке о данных, поскольку в большинстве случаев хороший специалист по машинному обучению может не уметь быстро анализировать бизнес, но отлично подойдет для решения сложных бизнес-задач, которые не могут быть решены. традиционными методами. Помня об этом, у нас есть команда ниндзя бизнес-аналитики, которые быстры, как ниндзя, и помогают нам всегда быть в тонусе.

Вот несколько предметов, созданных нашими ниндзя BA:

  • Полная информационная панель PowerBI для каждой службы (у нас ~ 35 информационных панелей, каждая из которых отслеживает ~ 50 показателей продукта/бизнеса!)
  • Управление данными — обеспечение того, чтобы данные были в правильном формате, чтобы пользователи могли получить их в любое время.
  • Они являются хранителями всех отчетов, доставленных в почтовые ящики всех заинтересованных лиц вовремя и в правильном формате.
  • Активаторы для маркетинговых кампаний, потому что они предоставляют данные и идеи для кампаний, а затем также их измеряют!
  • Помогает бизнесу/продуктам дать представление о влиянии любого изменения на бизнес до фактического внесения каких-либо изменений в стратегию/функции.

Мы все еще развиваемся и ищем способы сделать эту установку более надежной и готовой к работе с 10-кратным объемом!

Посмотрите это пространство, чтобы узнать больше о том, как мы развиваем наш стек Data Science, чтобы соответствовать требованиям быстрорастущего бизнеса.

Первоначально опубликовано на https://www.linkedin.com.