Получите лучшую модель машинного обучения, обучая ее так, как вы обучаете ребенка.

Обучение по учебной программе. Похоже на то, что происходит, когда ты идешь в школу, верно? Это. И оказывается, что это также помогает системам машинного обучения учиться лучше.

Кажется, мы что-то сделали правильно, когда учили себя.

По большому счету, системы машинного обучения, независимо от того, используют ли они простые нейронные сети, глубокое обучение или что-то еще, о чем вы, возможно, слышали, в основном делают акцент на двух вещах:

  • Качество данных
  • Объем данных

Качество данных, конечно, чрезвычайно важно. «Мусор на входе, мусор на выходе», возможно, вы уже слышали. Это относится и к машинному обучению. Если вы обучаете систему машинного обучения на мусоре, она выучит мусор и вернет вам мусор.

Объем данных также важен, потому что системе машинного обучения необходимо «увидеть» достаточное количество примеров из ваших данных, чтобы понять, как сделать то, что вы от нее хотите.

Например, если вы хотите, чтобы ваша система машинного обучения предсказывала, какой сегмент клиентов с наибольшей вероятностью совершит покупку, и оставалась лояльной к вашему бизнесу, вам нужно предоставить ей множество примеров клиентов, которые, как вероятно, так и вряд ли купят, а также клиентов, которые оставаться верным и не оставаться верным. Только тогда система машинного обучения сможет понять нюансы этих разных типов клиентов и предсказать, кто купит и останется лояльным.

Просто и понятно, правда? Ничего такого, чего вы еще не знали.

Так что же насчет обучения по школьной программе?

Прямо сейчас, если система машинного обучения работает плохо — например, приведенная выше модель предсказывает неправильные типы клиентов, которые, по ее мнению, будут покупать и/или оставаться верными вам — это обычно означает, что она не была обучена на достаточном количестве данных.

А обычное и очевидное решение? Получайте больше данных и обучайте их лучше.

Однако, подражая тому, как мы, люди, учимся, как мы учим своих детей в школе, мы можем помочь машине лучше учиться без дополнительных данных. На самом деле, используя те же данные, но просто обучая машину другим способом, можно повысить ее производительность.

Это просто фантастика, потому что одной из самых больших проблем машинного обучения для многих компаний является получение достаточного количества данных.

Как работает обучение по программе?

Если вы дошли до этого места, вы, вероятно, хотите немного узнать о том, как то, как мы, люди, учимся, может помочь нашей машине учиться лучше.

Оказывается, это совсем не сложно.

Учим ребенка узнавать автомобили

А теперь представьте вместе со мной, как бы вы учили своего ребенка. Скажем, вы хотите научить ее, что такое машина. Как бы вы это сделали? Возможно, каждый раз, когда вы видите машину на дороге, вы будете указывать на нее и говорить своему ребенку, что это машина. Когда вы вместе читаете книгу, и там есть изображение автомобиля, вы также указываете на него. Когда вы отвезете ее в школу, подчеркните, что вы едете на машине. В общем, машина, машина и машина.

Чего вы не будете делать в начале, так это начать говорить, что это Honda, Toyota или Ferrari. И не скажешь, что это внедорожник, или спорткар, или 2-дверный седан, или кабриолет. По сути, вы начинаете с самого широкого ярлыка — «автомобиль». Все просто «автомобиль».

Только после того, как ваш ребенок научится распознавать автомобили, вы пойдете глубже и разложите его, скажем, на типы автомобилей, марки автомобилей или цвета автомобилей.

Обучение машины с помощью обучения по учебной программе

Итак, с машиной мы делаем то же самое. Мы используем ваши данные и сначала даем им общие названия. Как и "автомобиль". Потом тренируем.

Далее мы используем те же самые данные, но даем им более точные метки. «Седан», «кабриолет», «спорткар», «внедорожник». Потом снова тренируем.

И мы продолжаем делать это, пока не достигнем желаемого уровня детализации. Скажем, например, «красная спортивная машина Honda».

Это лучше?

да. И результаты довольно стабильны.

Практически для любого вида обучения использование или включение обучения по учебной программе помогает системе машинного обучения работать лучше. В некоторых случаях более чем на 10% лучше.

Конечно, есть некоторые дополнительные усилия по присвоению широких ярлыков вашему набору данных. Однако, по нашему опыту, это обычно можно получить довольно быстро и в большинстве случаев в высокой степени автоматизировать. Поскольку мы уже работаем над подробными метками, обычно следуют некоторым правилам, чтобы можно было определить общие метки. И поскольку это основано на правилах, его обычно легко автоматизировать.

Это означает, что этот метод, хотя и требует немного больше усилий, почти гарантирует вам лучшую модель ИИ. Это может легко стоить того. Это то, что мы учитываем и, если возможно, применяем при создании моделей машинного обучения для себя и для наших клиентов.

Эта статья впервые появилась в блоге Qavar по адресу https://blog.qavar.com/what-is-curriculum-learning-in-ai-and-how-does-it-help-me/.