Впервые я прочитал о бережливом мышлении в книге Машина, которая изменила мир, основанной на пятилетнем исследовании Массачусетского технологического института, посвященном будущему автомобилестроения. Концепция бережливого производства включает в себя такие идеи, как своевременная доставка, устранение потерь в системе, постоянное совершенствование и совместная работа всей команды для оптимизации процесса. В то время я изучал применение бережливого мышления в строительной отрасли. В то время в моде было понятие проектирование/строительство, подход, который ускоряет сроки проекта, разбивая этапы и итеративно сотрудничая с архитекторами, инженерами и подрядчиками. Вместо того, чтобы заранее проектировать все здание, архитектор начинает передавать планы и работать с инженерами намного раньше, чтобы они могли быстро приступить к работе с подрядчиками. Это не только ускоряет строительство, но и позволяет решать проблемы, которые неизбежно возникают в процессе, как правило, с гораздо меньшими затратами.

Еще одним предметом, который я изучал и даже немного преподавал в аспирантуре, было составление расписания. Для любого проекта важным подходом является критический путь доставки. Основная предпосылка заключается в том, что каждое действие в проекте либо зависит от завершения предыдущего действия, либо оно может «плавать», что означает наличие свободы действий, когда оно должно быть выполнено, чтобы обеспечить своевременное выполнение проекта. Критический путь — это кратчайшее время, необходимое для завершения всех действий, которые имеют зависимости. Узкие места, такие как ручная маркировка обучающих данных, выделяются и исправляются.

Когда я занялся разработкой программного обеспечения и принял Agile, я увидел огромное сходство между фундаментальными принципами. Разбейте проект на управляемые части, проводите регулярные проверки с заинтересованными сторонами, ретроспективно анализируйте и планируйте следующую итерацию, перераспределяя приоритеты на основе внутренних и внешних факторов. Я вижу, что наука о данных медленно принимает эту концепцию, особенно когда речь идет о человеческих усилиях по маркировке. Стало нормой предоставлять большой набор примеров группе по маркировке данных и ждать, пока все они будут помечены, прежде чем даже пытаться обучить модель и увидеть результаты.

Трудно предсказать, сколько помеченных примеров будет достаточно для правильного обучения модели машинного обучения, поэтому не ждите, пока все примеры будут помечены. По крайней мере, проверяйте еженедельно, чтобы включить помеченные примеры в конвейер и оценить результаты. Еще один трюк, который ускорит работу над проектами, — это использовать небольшое количество предварительно помеченных примеров и запустить классификатор, который синтетически помечает остальные (да, я говорю о тебе, Джексон). Целью любых усилий по маркировке является получение «золотых» этикеток с высокой степенью достоверности. Под золотым я подразумеваю предварительно размеченные примеры, которые будут служить исходной истиной для обучения, тестирования и калибровки модели.

Активное обучение — еще одна отличная техника для вплетения в процесс. При активном обучении модели машинного обучения помогают расставить приоритеты в порядке, в котором примеры помечаются людьми, выявляя примеры, которые с большей вероятностью заполнят пробел в покрытии модели. Модель очень часто имеет перекос, и усилия по маркировке обычно более случайны в том, какие примеры помечаются и в каком порядке. Возможность затыкать эти дыры с помощью моделей и/или эвристик — еще одно преимущество более рационального подхода к обучению моделей. Как обсуждалось в сообщении технического директора Jaxon Ошеломленный и растерянный, рассмотрите возможность обучения специализированных моделей — возможно, бинарных классификаторов — для устранения наиболее проблемных границ между запутанными классами. Они могут принимать форму чего угодно, от продвинутых моделей глубокого обучения до простых эвристик, закодированных человеком, — всего, что может помочь различить эту конкретную границу.

Примите концепции бережливого мышления, метода критического пути и методологий Agile. Разбейте циклы на более короткие промежутки маркировки, чтобы увидеть, какое влияние это окажет. Наклейки-люди в какой-то момент столкнутся с убывающей отдачей, и вы сможете определить, когда это произойдет, намного раньше. Попробуйте технологии усиления машинного обучения, такие как Jaxon.AI, и получите лучшие результаты, намного быстрее и с меньшими ресурсами. Получите быстрый путь к золоту!

Опубликовано

Скотт Коэн, генеральный директор Jaxon.AI

Первоначально опубликовано на https://www.linkedin.com.