Мы в Nearby Technologies твердо верим в методологию, основанную на данных, прежде чем принимать какие-либо бизнес-решения, и теперь это встроено в нашу ДНК, чтобы «тестировать-измерять-внедрять» все и вся!
Мы являемся одним из первых лидеров финтеха, у которого есть собственная команда по науке о данных, которая позволяет бизнесу принимать решения на ходу с помощью вспомогательных данных и интеллектуальных идей.
Спасибо нашей собственной команде опытных ученых и аналитиков данных, которые достигают наших сложных целей по поддержанию работоспособности всей системы 24 часа в сутки 7 дней в неделю.
Данные имеют решающее значение, и для принятия высокоэффективных решений мы в Nearby tech начали собирать огромное количество данных из разных источников, но для того, чтобы собрать все в одном месте, нужна была команда, которая могла бы извлечь из данных ценность. Именно тогда появилась команда Data Science. Два года назад мы начали этот путь, и сегодня мы помогаем бизнесу использовать эти данные в принятии решений, отслеживании KPI, маркетинге и продажах.
Текущая система
Источник:
В разных системах ~200 источников данных!
Таким образом, мы можем представить себе задачу собрать все данные в одном месте и создать единый источник записей, что является лишь первым шагом к созданию полноценного стека обработки данных.
Конвейеры ETL:
В Nearby мы принимаем ~ 200 миллионов транзакционных записей в месяц с более чем 200 активными конвейерами!
Безопасность данных лежит в основе технологий Nearby, и это одна из причин, по которой мы создали нашу ETL-платформу на GCP. Это не только помогло нам защитить данные, но и помогло нам сэкономить деньги, которые могли бы быть огромными, если бы мы выбрали какой-либо сторонний инструмент ETL.
Хранилище данных и озеро данных:
Мы используем два типа хранилищ данных для решения различных задач.
- Google BigQuery — это инструмент хранилища данных со столбцами, основанный на модели оплаты за сканирование.
- Облачное хранилище — здесь мы храним холодные данные и часто очищаем их.
Ниже перечислены некоторые общие рекомендации, которые следует учитывать при настройке и использовании Bigquery.
- Избегайте использования вместо этого Select *, укажите нужный столбец. Этот метод поможет вам значительно сократить расходы.
- Используйте кластерный метод разделения данных при хранении данных, это помогает снизить стоимость запроса, даже если вам нужно сканировать самую тяжелую таблицу.
- Храните холодные данные в отдельной таблице, так как активные и холодные данные оцениваются по-разному в GCP.
Визуализация данных, информационные панели и отчетность:
Мы используем PowerBI для создания информационных панелей, визуализации и создания отчетов. Это универсальный источник всех показателей продукта и бизнеса, который широко используется в организации для отслеживания производительности продукта и состояния бизнеса. Это позволяет старшему руководству и CXO быть в курсе всех ключевых показателей, а также дает им пользовательский интерфейс, откуда на основе фильтров они могут извлекать метаданные.
Мы также используем Automailers для отправки многих отчетов прямо в почтовый ящик заинтересованных лиц с помощью R/python.
BigQuery — это единый источник для всех потребностей бизнес-пользователей в доступе к данным, единственное необходимое условие — базовые знания SQL.
Машинное обучение:
У нас есть специальная команда специалистов по данным, которые вместе работают над созданием надежных систем, которые помогают легко достигать наших бизнес-целей.
Вот несколько систем, созданных нашими специалистами по данным:
- Система перекрестных продаж продуктов основана на использовании продукта, местоположении и роде деятельности.
- PAN и Adhaar OCR с использованием Google Vision и уровня машинного обучения — с помощью этой системы мы смогли считывать данные непосредственно с изображения, тем самым уменьшая количество человеческих ошибок.
- Модель прогнозирования оттока: мы смогли предсказать, кто покинет систему в течение следующих 15 дней, тем самым заблаговременно разработав стратегию удержания, которая, в свою очередь, помогла нам достичь ~85%–90% секунд. -месяц удержания агентов
- Оптимизация цен
- Оценка рынка с использованием многоуровневой модели машинного обучения, которая помогла нам понять новую область, в которой может быть создан рынок, что помогло бизнесу разработать стратегию своих функций продаж.
- Геймификация продаж. Что такое геймификация для неигровой индустрии?
"Использование характерных игровых элементов в обычно неигровых контекстах для создания игрового опыта, повышающего ценность пользователей"
Это именно то, что мы сделали и создали игровой процесс для наших клиентов, который, в свою очередь, повысит вовлеченность пользователей. Мы назвали его «Таблица лидеров». Это платформа, на которой мы позволяем нашим клиентам зарабатывать больше, и платформа, которая дает им прилив адреналина, чтобы занять первое место в регионе, прививая им чувство соперничества.
Бизнес-аналитика:
«Один размер подходит всем» — это то, что не применимо ни к одной команде по науке о данных, поскольку в большинстве случаев хороший специалист по машинному обучению может не уметь быстро анализировать бизнес, но отлично подойдет для решения сложных бизнес-задач, которые не могут быть решены. традиционными методами. Помня об этом, у нас есть команда ниндзя бизнес-аналитики, которые быстры, как ниндзя, и помогают нам всегда быть в тонусе.
Вот несколько предметов, созданных нашими ниндзя BA:
- Полная информационная панель PowerBI для каждой службы (у нас ~ 35 информационных панелей, каждая из которых отслеживает ~ 50 показателей продукта/бизнеса!)
- Управление данными — обеспечение того, чтобы данные были в правильном формате, чтобы пользователи могли получить их в любое время.
- Они являются хранителями всех отчетов, доставленных в почтовые ящики всех заинтересованных лиц вовремя и в правильном формате.
- Активаторы для маркетинговых кампаний, потому что они предоставляют данные и идеи для кампаний, а затем также их измеряют!
- Помогает бизнесу/продуктам дать представление о влиянии любого изменения на бизнес до фактического внесения каких-либо изменений в стратегию/функции.
Мы все еще развиваемся и ищем способы сделать эту установку более надежной и готовой к работе с 10-кратным объемом!
Посмотрите это пространство, чтобы узнать больше о том, как мы развиваем наш стек Data Science, чтобы соответствовать требованиям быстрорастущего бизнеса.
Первоначально опубликовано на https://www.linkedin.com.