Отсутствие стандартизированной модели процесса разработки в области машинного обучения приводит к плохо организованным инициативам, противоречивым результатам и использованию специальных методов.

Чтобы устранить эту проблему, недавно был предложен межотраслевой стандартный процесс разработки приложений машинного обучения с методологией обеспечения качества (CRISP-ML(Q)).

Модель CRISP-ML(Q) делит жизненный цикл разработки на шесть основных этапов, которыми руководствуются специалисты по машинному обучению.

Модель процесса `CRISP-ML(Q)` описывает шесть фаз:

1. Понимание бизнеса и данных
2. Подготовка данных
3. Построение модели
4. Оценка модели
5. Развертывание
6. Мониторинг и обслуживание

Этапы процесса разработки ML должны выполняться в определенном порядке, но рабочий процесс по своей сути является итеративным и исследовательским, и предыдущие этапы, возможно, потребуется пересмотреть на основе результатов последующих этапов.

Давайте подробно рассмотрим этапы CRISP-ML(Q);

  1. Понимание бизнеса и данных:

I) Бизнес-понимание: это самый первый этап проекта, на котором вы будете работать с основными требованиями проекта и должными знаниями и результатами проекта.

Это:

  • Бизнес-цель
  • Ограничение бизнеса
  • Критерии успеха в бизнесе
  • Критерии успеха машинного обучения
  • Критерии экономического успеха
  • Устав проекта (Это первый документ, который готовится для любого проекта)

II) Понимание данных. Понимание данных — это процесс изучения и понимания типа данных набора данных, источников и другой соответствующей информации.

  • Типы данных (дискретные, непрерывные, перекрестные и т. д.)
  • Сбор данных (первичные и вторичные источники данных)

Для следующего этапа следите за обновлениями, а затем подписывайтесь на меня в LinkedIn.