Ответ на Великий Вопрос… О Жизни, Вселенной и обо всем… Это… «Сорок два, — сказал Глубокий Мысль с бесконечным величием и спокойствием.

Краем глаза Пхугг видел море напряженных ожидающих лиц на площади снаружи.

«Нас собираются линчевать, не так ли?» он прошептал.

Придумать, казалось бы, изящный ответ на сложную проблему несложно. Знать, как построить вопрос, сложно.

При построении готовых к производству моделей машинного обучения — особенно в коммерческом контексте — определение «вопроса» часто является всей «проблемой».

И вопросы не прекращаются…

Как мы должны построить наши обучающие данные?

Сколько обучающих данных мы должны использовать?

Сколько времени мы должны потратить на очистку обучающих данных?

Какой алгоритм дает наилучшие результаты?

Когда у нас есть алгоритм, каков приемлемый компромисс между вычислительной эффективностью и его точностью?

Как мы поставляем эту модель, чтобы ее было легко обслуживать?

…вы поняли.

В Madgex у нас есть огромное количество данных для обучения — более 37 миллионов документов о вакансиях с соответствующей информацией о заработной плате, секторе, функции и контракте — и большой список пожеланий потенциальных вариантов использования: от классификации документов до сопоставления работы / кандидата; от карьерных советов по искусственному интеллекту до расширенных приложений для письма.

Задача команды специалистов по обработке и анализу данных — расставить приоритеты в списках пожеланий и обеспечить возможность быстрого и эффективного перехода от исследований и разработок к производству и развертыванию.

Для этого мы разработали набор принципов, основанный на 7 навыках высокоэффективных людей Стивена Кови.

Хотя это и не совсем соответствует исходному материалу (мы переработали структуру некоторых привычек), он дал нам практический способ разработки готовых к производству моделей машинного обучения, не утопая в море наших собственных вопросов.

Быть инициативным

Не попасться. Старайтесь предвидеть любые проблемы до того, как они возникнут.

Начните с конца в виду

Определите четкий вариант использования. Составьте план достижения этой конечной цели.

Ставьте главное на первое место

Установите приоритет рабочего процесса данных. Важные дела не всегда срочные.

Думайте обоюдно

Сбалансируйте эффективность с эффективностью. Коммерческий характер и точность не исключают друг друга.

Стремитесь сначала понять, а потом быть понятым

Не делайте никаких предположений. Поговорите с людьми, которые будут использовать выходные данные модели.

Синергия

Решение проблем — это творческий процесс. Вам не нужно программировать, чтобы быть в команде по науке о данных.

Заточи пилу

Модель никогда не бывает законченной. Тестируйте их, измеряйте результаты, улучшайте их.

Поскольку влияние машинного обучения и «ИИ» продолжает расширяться, количество возможных вопросов также будет расти. Не на все эти вопросы следует отвечать.

Мы думаем, что, придерживаясь наших принципов, мы сможем продолжать создавать полезные ответы на важные вопросы.