Около года назад наша старшая дочь учила цвета и у нее был плохой отпечаток. Читая «Загадку цвета» Скуби-Ду, она перепутала слова «шляпа» и «желтый». В результате все, что было желтым, теперь называлось «шляпой». «У птицы шляпный клюв» или «банан — это шляпа».

Это напомнило мне о нескольких случаях, когда мы впервые создавали наш движок NLU для Ubi. У нас был плохой набор обучающих данных, что в конечном итоге привело к еще худшей производительности, чем мы ожидали. Мы создавали классификатор для таймеров и будильников «Напомни мне через 10 минут проверить макароны» или «Установи будильник через 2 минуты». Выяснить и уловить намерение во время высказывания может быть очень сложно, но еще труднее может быть сущность.

В примере о том, в зависимости от продолжительности обучения, система может принять напоминание как «Проверить макароны» или «Проверить макароны». Или он может идентифицировать объект напоминания как «с этого момента», а не вычислять, что это объект времени, как «[настоящее время] + 00:02:00.00».

Машинное обучение имеет огромный потенциал для экономии времени за счет сокращения утомительных процессов за счет автоматизации, однако оно полезно только в качестве обучения. Плохое обучение приводит к плохому обучению, но даже при хорошем обучении можно получить неправильные знания.