Несколько основателей Source Summit AI обнаружили, что у них есть наборы данных, которые, по их мнению, можно было бы монетизировать, но они задавались вопросом, как создать модель, построенную на их основе, без найма на полную ставку или дорогостоящих консультаций.

Kaggle появился как потенциальное решение — это онлайн-платформа, которая ставит задачи по науке о данных с прикрепленными призовыми деньгами. Если у вас есть данные, вы публикуете задачу, раскрываете часть данных, которые будут использоваться учеными для обучения своих моделей, и утаиваете часть данных для Kaggle, чтобы проверить точность их прогнозов.

В одном открытом конкурсе NOAA (Национальное управление океанических и атмосферных исследований, правительственное агентство США) предлагает от 5000 до 12000 долларов трем лучшим командам, которые создадут алгоритмы, которые могут сканировать фотографии океана и подсчитывать морских львов, чтобы быстро определить их текущую численность населения. Эти фотографии уже были вручную оценены биологами, поэтому оценки, предоставленные алгоритмами, будут сопоставлены с этими числами, чтобы оценить их точность.

Другим примером является конкурс, проводимый Intel и MobileODT, в котором просят алгоритмы просматривать изображения шейки матки женщин и оценивать их тип, чтобы улучшить скрининг рака. Как и в вышеупомянутом конкурсе, прогнозируемые результаты заявок будут сравниваться с фактическими результатами, определенными врачами. Другие конкурсы вращались вокруг предсказания цен на российском рынке жилья и тегирования видео.

Kaggle определяет процесс следующим образом:

Определите: определите ценную проблему машинного обучения, для которой у вас есть данные.

Объем: работайте с нами, чтобы уточнить постановку задачи и завершить набор данных.

Создавайте: сотрудничайте с нами, пока мы создаем страницы ваших конкурентов.

Запуск: общайтесь на форумах, просматривайте общий код и наблюдайте, как улучшаются модели в таблице лидеров.

Учитесь: получайте код и документы от победителей и отвечайте на звонки по обмену знаниями.

Глядя на ряд открытых в настоящее время конкурсов, можно собрать сотни заявок и определить, какая из них лучше всего анализирует ваши данные. Лучше всего то, что эти материалы разрабатываются параллельно, что значительно ускоряет процесс разработки. Текущие призы варьируются от 25 000 до 100 000 долларов США, что может быть более доступным или быстрым, чем другие варианты.

Однако обратите внимание, что проведение конкурса предполагает публичную загрузку части ваших данных, поэтому убедитесь, что у вас есть на это законное право.

Соревнования Kaggle могут удовлетворить ваши потребности, но, скорее всего, они предоставят вам доказательство концепции для дальнейших инвестиций. Затем у вас есть более четкая задача, которой можно поделиться с фрилансерами, или отправная точка для найма команды на полный рабочий день. В любом случае, проведение конкурса Kaggle — один из самых быстрых способов узнать больше о ваших данных.

Узнайте, как применять ИИ — ai.source.institute