Сможет ли машинное обучение демократизировать развитие ИИ?

Я работаю с рядом организаций, находящихся на разных уровнях зрелости, в их стремлении использовать ИИ для получения устойчивой ценности для бизнеса.

Проблемы, с которыми сталкиваются эти организации, различны. Некоторые из этих проблем заключаются в том, чтобы найти подходящих специалистов для разработки моделей, получить соответствующие данные и ввести их в действие, что включает в себя обновление моделей, чтобы можно было получить устойчивую ценность.

Большинство методов, распространенных сегодня, полагаются на доступность большого массива размеченных данных. Этот набор данных используется для обучения модели. Этот подход оказался очень успешным при решении проблем, которые по своей сути связаны с данными (например, прогностические модели) или связаны с восприятием (например, распознавание изображений или распознавание речи). Однако при решении проблем, связанных с познанием предметной области (например, извлечением знаний) или конкретными системами управления, этот метод имеет тенденцию быть очень неэффективным и требует инвестиций, которые могут быть недоступны для многих организаций. Например, чтобы разработать модель, которая может контекстуально анализировать финансовые документы по конкретным темам, нам, как правило, потребуется иметь значительную базу активов с помеченными документами для обучения модели. Вот тут-то и начинается проблема: для того, чтобы пометить эти документы, требуются значительные усилия экспертов в предметной области. Эти данные должны быть проверены на основе спецификаций организации, для которых организация должна полагаться на своих экспертов в предметной области. После маркировки данные также очень редко можно использовать повторно. Маркировка данных — рутинное занятие для экспертов в предметной области, неэффективное использование их времени и зачастую дорогостоящее занятие. Этот метод также приводит к моделям, которые являются черными ящиками и трудно поддаются объяснению. Смещение, присущее данным, используемым для обучения модели, может проникнуть в модель. Изменения в данных вызывают дрейф модели, который требует переобучения. Для разработки и поддержки таких моделей необходима армия специалистов по данным и инженеров.

Недавно меня заинтересовал подход машинного обучения. Как поясняется в этой статье Microsoft Research https://www.microsoft.com/en-us/research/group/machine-teaching-group/, этот подход обещает следующее.

Снижайте зависимость от специалистов по данным, он использует опыт экспертов в предметной области для помощи в обучении и разработке модели. Это отличается от маркировки данных, поскольку эксперты в предметной области предоставляют информацию, которая используется для обучения модели. Это функции или концепции, которые помогают машинному обучению. Это действительно поможет демократизировать разработку ИИ, позволив организациям сосредоточиться на определении функций, которые будут обучать машину, а не разбираться со сложностями базовых алгоритмов. Это очень похоже на то, как эволюционировали абстракции в программировании, чтобы сделать разработчика программного обеспечения более продуктивным и снизить планку для того, чтобы стать эффективным разработчиком.
Это позволит намного быстрее разрабатывать модели, автоматизируя большую часть процесса машинного обучения и требуя очень мало предварительно размеченных данных или вообще не требуя их. Модели гораздо более объяснимы, поскольку можно будет документировать функции, которые обучили модель, и, таким образом, их гораздо легче обновлять.

Практическая реализация этого подхода была разработана здесь https://www.microsoft.com/en-us/research/project/platform-for-interactive-concept-learning-picl/

По сути, машинное обучение, по-видимому, полагается на экспертов в предметной области для систематизации своих знаний и концепций предметной области в качестве функций, которые предоставляются в качестве входных данных для разработки модели. Эта информация вместе с традиционными методами машинного обучения используется для обучения модели машинного обучения. Платформа принимает ряд решений о том, какие алгоритмы и параметры использовать в процессе. Это, в свою очередь, делает процесс разработки модели более прозрачным и обновляемым, поскольку информация, предоставленная экспертами в предметной области, может быть настроена для изменения поведения модели.

Этот подход, безусловно, будет включать в себя сильную игру платформы, где большую роль будут играть инструменты, основанные на методах обучения, пользовательском опыте и базовой платформе обучения.

Этот подход имеет многообещающие перспективы, поскольку делает разработку ИИ доступной для широких масс. Это позволяет организациям разрабатывать модели, адаптированные к их потребностям, без создания большой армии специалистов по данным и инженеров. Любая организация, которой сегодня нужны специалисты в предметной области для создания размеченных данных для развития машинного обучения, должна извлечь выгоду из этого подхода.

Еще неизвестно, станет ли машинное обучение просто еще одним модным словечком или сможет реализовать свое обещание. Я взволнован тем, что я видел, и вы должны быть тоже…

Примечание. Эта статья отражает личную точку зрения автора и не отражает и не претендует на отражение какой-либо официальной точки зрения Microsoft.

Сможет ли машинное обучение демократизировать развитие ИИ?

Вопросы по теме