В июле мы были на организованной HasGeek конференции Fifth Elephant, на которой прошли разнообразные беседы с практиками в области данных из Flipkart, InMobi, Swiggy и других. Наш соучредитель Scribble Data Венката Пингали помогла HasGeek разработать программу для двухдневной конференции. Как вы, возможно, уже знаете, мероприятия Fifth Elephant проводятся при поддержке сообщества и направлены на развитие инноваций в области данных и ИИ в Индии.

Нам было особенно интересно узнать и обсудить конкретные проблемы, над которыми думают организации, управляемые данными, и то, как они их решают. Мы не были разочарованы. Вот 3 ключевых вывода конференции, которые являются сильными сигналами в том, где находится передовой край прикладной науки о данных (то есть в промышленности и в производстве).

— — — —

(1) Модные словечки называют модными

За последние пару лет отрасль наладила определенный способ взаимодействия с более широкой аудиторией - цикл модных словечек, которые были частично понятны, но по-прежнему востребованы ключевыми лицами, принимающими решения в области технологий. Мы слышали о проектах по улучшению резюме, в которых реализовано сложное статистическое моделирование, но которые не могут быть внедрены в производство. Обсуждения на конференции развеяли пыль пикси и заставили всех познакомиться с основами реальных данных. Это был свежий способ подвести итоги направлений, в которых инженерия данных и машинное обучение решают проблемы на различных уровнях предприятия. Наш вывод: резина начинает встречаться с дорогой. Наука о данных всегда была сложной и трудоемкой. Приятно видеть нарисованную более реалистичную картину.

(2) Жизненно важная роль инженерии данных в развитии науки о данных

Спикеры из таких организаций, как Samsung и Slack, раскрыли нюансы границ инженерии данных и науки о данных. Они взаимосвязаны и подпитывают друг друга, но понимание их индивидуальных ролей в большой игре жизненно важно для успешного производства. Когда дело доходит до экспериментов, наука о данных гибка, но они не всегда выходят в свет в виде реальных развертываний. Серьезная проблема связана с инженерией данных, которая прокладывает конвейеры (целостность данных, надежность, частота и т. Д.).

Возможности и проблемы, которые могут решить Data Science и ML, многочисленны, но для того, чтобы эти решения сработали, необходимо создавать команды, которые ценят хорошо продуманные, масштабируемые и надежные системы и процессы.

(3) Неожиданные дебюты и блестящие новые возможности

Заметно присутствие новых, несколько неожиданных участников, таких как Cummins (двигатели), Mahindra (электромобили и мобильность) и Star TV (развлечения). «Разброс» компаний, занимающихся информационным бизнесом, растет. Кажется, у каждого есть мандат на развитие своих команд и инфраструктуры. Бангалор, безусловно, сохраняет свои позиции центра профессионалов в области данных. Большинство из этих новичков рассматривают возможность открытия здесь офисов, что делает Бангалор центром данных страны.

— — — —

Сегодня компании жаждут экспертов по данным. Бангалор станет лучшим местом для найма специалистов этой категории, но что потребуется миру данных, чтобы инициативы в области аналитики / обработки данных / машинного обучения продолжали набирать популярность, а не воспринимались как эксперименты? Мы думаем, что речь пойдет о людях и о том, как они взаимодействуют.

В частности, это означает больше диалога и готовность делиться информацией - особенно когда речь идет о проблемах и неудачах, которые мы преодолели или пересмотрели. В связи с этим нам особенно понравилась конференция «Пятая слониха», поскольку она предоставила докладчикам платформу, в том числе секции «BOF» («птицы из пера») и общее дружелюбие между участниками во время сетевых сессий. Вот еще кое-что.