Нью-Йоркский университет и UBC предлагают обучение на основе отклонений для улучшения обучения системе рекомендаций

Независимо от того, идет ли речь о поиске боевиков, электронных велосипедов или лучшего маршрута в кафе, рекомендательные системы на основе данных будут просеивать бесчисленные возможности и направлять пользователей к решениям, которые наиболее соответствуют их потребностям и предпочтениям. Рекомендательные системы могут использовать опыт знающих экспертов, а также информацию в реальном времени, к которой пользователи не могут легко или быстро получить доступ. Хотя они получили широкое распространение и доказали свою эффективность в бизнес-стимуляторах, рекомендатели далеки от совершенства и, как правило, не могут предсказать выгоды пользователей, связанные с конкретными альтернативами.

В статье Обучение на основе отклонений группа исследователей из Нью-Йоркского университета и Университета Британской Колумбии предлагает обучение на основе отклонений — новый подход к обучению рекомендательных систем, который изучает знания пользователей, наблюдая, следуют ли они или отклоняться от предоставленных рекомендаций.

Исследование обучает рекомендательную систему на основе прошлых данных рекомендаций и окончательных решений пользователей с целью оценки моделей путем наблюдения за отклонениями опытных пользователей. Идея состоит в том, что если модель хорошо обучена, опытные пользователи будут меньше отклоняться от ее рекомендаций; в то время как, если отклонения велики, рекомендатель признает, что он неправильно оценил основное состояние. Кроме того, если пользователь следует определенной рекомендации, даже если достоверность прогноза низкая, уровень достоверности таких прогнозов может быть соответственно повышен, что приведет к созданию более точных и полезных систем.

Чтобы учитывать прогнозы вознаграждений пользователей, в существующих рекомендательных подходах используется обучение на основе оценок, которое заменяет вознаграждения предоставленными пользователями рейтингами. Однако в документе отмечается, что рейтинги, созданные пользователями, часто основаны на различных предубеждениях и, таким образом, предоставляют лишь ограниченные информативные сигналы относительно реальных выплат пользователей.

Команда также утверждает, что обучение на основе рейтинга может быть бессильным, например, при обнаружении проблем и опасностей в автомобильной навигации и планировании маршрута, поскольку подробные рейтинги и обзоры часто недоступны, и если навигационное приложение ждет, пока не обнаружит низкие выплаты, задержки, могут произойти инциденты или несчастные случаи. Кроме того, такие проблемы нельзя эффективно решить путем ручного ввода информации об опасностях, поскольку трудно заранее узнать и перечислить все соответствующие опасные условия.

Предлагаемый подход к обучению на основе отклонений решает такие проблемы навигации, используя знания местных (экспертных) водителей. Наблюдая за отклонениями местных водителей от предложенного маршрута, рекомендатель может обновить свои знания о статической карте; в то время как если местные водители выбирают маршрут, который система считает опасным, рекомендатель также может использовать эту информацию для обновления своих знаний об этой дороге.

Команда предоставляет результаты моделирования для предлагаемого подхода к обучению на основе отклонений, включая графики кумулятивного сожаления, которые анализируют, как сожаление и ширина доверительной области меняются с течением времени; графики, показывающие, как обновляется ширина доверительной области; и прирост точности от каждой рекомендации в отношении бинарных и троичных рекомендаций.

Команда приходит к выводу, что получение информации из обучения на основе отклонений наиболее эффективно, когда выигрыши ненаблюдаемы, есть много знающих экспертов, и рекомендатель может легко определить набор экспертов. В целом предлагаемый подход направлен на предоставление информационных преимуществ в общих средах, которые можно использовать для повышения точности рекомендательных систем и, в конечном счете, помочь пользователям принимать более правильные решения.

Статья Обучение на основе отклонений размещена на arXiv.

Автор: Геката Хе | Редактор: Майкл Саразен

Мы знаем, что вы не хотите пропустить ни одной новости или научного открытия. Подпишитесь на нашу популярную рассылку Synced Global AI Weekly, чтобы получать еженедельные обновления AI.

Нью-Йоркский университет и UBC предлагают обучение на основе отклонений для улучшения обучения системе рекомендаций

Вопросы по теме