Почему Kaggle не является инклюзивным и как создать более инклюзивную платформу для анализа данных

‘Если вы хотите хорошо плавать в бассейнах, это нормально, выбирайте Kaggle. Если вы хотите хорошо провести время в открытом море, выберите Омдена - Леонардо Санчес, соавтор Omdena Challenge из Бразилии.

«То, что я узнал за последние пару месяцев в испытании ИИ Омдены, намного больше, чем то, что я узнал на всех соревнованиях вместе взятых», - Мурли Сивашанмугам, соавтор Omdena Challenge из Индии.

Не поймите меня неправильно, я думаю, что Kaggle - отличная платформа для специалистов по обработке данных, чтобы отточить свои навыки и применить полученные уроки в теории.

Но вот почему этого недостаточно.

Если вы специалист по обработке данных, вам придется бороться за 0,1%, чтобы быть лидером в Kaggle. В реальной жизни в большинстве случаев прилагать усилия для этого не стоит. Добавление исследования утечек данных, суммирования, повышения, ансамбля для достижения 0,1% является обязательным. Конечно, для таблицы лидеров это чрезвычайно ценно, но для реальной жизни это просто недостойно, поскольку снижает интерпретируемость.

Во-вторых, большинство построенных решений не могут быть воспроизведены в производственных средах. Помните, что в одном вы ищете результаты в таблице лидеров, а в другом вы строите комплексные решения.

Но что еще более важно, не у всех есть доступ к коллегам-специалистам по данным, с которыми можно работать и учиться. Например, такие люди, как Захида, мать-одиночка из Южной Африки, или Мунира, беженка из Сомали в Кении, расположены в отдаленных частях мира и могут не иметь других людей, с которыми можно было бы сотрудничать. Не у всех есть доступ к университету или они приезжают из больших городов, где они могут встретиться с другими учеными, занимающимися данными.



Организации, которые хотят бросить вызов Kaggle, должны сделать набор данных общедоступным, что не подходит для всех бизнес-моделей. Кроме того, для решения многих реальных проблем требуется, чтобы компания тесно сотрудничала с разработчиками, что невозможно в Kaggle.

Как улучшить Kaggle и сделать его более инклюзивным

Мы подумали, что будет здорово заставить людей сотрудничать со всего мира, объединив их в учебной среде для работы над интересной реальной проблемой.

«В прошлом я пытался участвовать в нескольких соревнованиях по« Kaggle », хотя это помогло мне улучшить мое понимание в области искусственного интеллекта, я чувствовал, что возможности обучения ограничены из-за контекста конкуренции. Я считаю, что лучше всего учиться, когда мы работаем вместе, как одна команда, преследующая общую цель », - Мурли Сивашанмугам, соавтор Omdena Challenge из Индии.

Преимущества для (начинающих) специалистов по данным

  1. Пачкать руки из реальной жизни. Рохит Пол из Индии. .
  2. Работайте в тесном сотрудничестве с экспертами в предметной области. Большинство реальных проблем не ограничиваются только проблемой науки о данных, но требуют привлечения экспертов в предметной области для создания ценности. Мы увидели, что, работая с экспертами в предметной области, специалисты по данным из разных областей помогают компании уточнить проблему и по-новому взглянуть на нее.

По словам Александра Ласкорунского из Израиля,

«Omdena может дать людям такой большой бонус, если будет упоминать в их резюме реальный опыт работы, который сейчас требуется любой компании».

Преимущества для организаций

  1. Отобранная группа из 30–40 практикующих с разными наборами навыков и уровнями опыта.
  2. Доступ к данным осуществляется внутри компании.
  3. Сообщество, решающее проблему, включает компанию (часто специалистов по обработке данных) посредством прямого контакта с проектом и, при необходимости, дополнительного участия.
  4. Члены сообщества внутренне мотивированы и часто сами сталкиваются с проблемой. Они не только создают модель, но и помогают компании уточнить проблему и поместить ее в более широкий контекст. Это то, что мы видим снова и снова во всех трудностях.

Я полностью согласен с акцентом на сообщество и правильных людей с определенной целью. На самом деле это ключ к созданию среды для совместной работы и обмена знаниями, и удивительно видеть, как это работает в действии.

Даниэль Мика, основатель стартапа Fashion AI

По словам Саурав Суман из Мировой продовольственной программы ООН в Непале,

Коллективный подход Omdena выводит инновации на совершенно новый уровень с идеей использования технологий для привлечения людей с различными способностями и работы над проблемой. Движущей силой этого подхода является ускоренное обучение за счет духа сотрудничества, наставничества и точного руководства.

За последние шесть месяцев наше сообщество создало модели глубокого обучения для обнаружения деревьев и предотвращения лесных пожаров с точностью 99%, модели прогнозирования для определения безопасных районов и маршрутов для прекращения сексуальных домогательств, а также модели для решения проблемы изменения климата и насильственных конфликтов.

Еще много примеров использования можно найти в нашем блоге.