Системы рекомендаций приобрели большое значение в индустрии электронной коммерции, где для пользователей создается широкий спектр вариантов. По сути, это система фильтрации информации, которая использует отзывы и сведения о пользователях для прогнозирования предпочтений пользователя в отношении того или иного элемента. Система рекомендаций может использовать предыдущее поведение или характеристики пользователей, чтобы предоставлять им персонализированный контент и услуги.

Скрытая и явная обратная связь

Чтобы система рекомендаций работала лучше, ей должно быть разрешено собирать и интегрировать необходимую обратную связь от пользователей. Эти данные связаны с индивидуальными характеристиками пользователей и элементов, данными, сгенерированными при взаимодействии пользователей с элементами в прошлом, и оценками, предоставленными пользователями элементу.

Явная обратная связь представлена ​​в виде оценок элементов, которые явно выставляются пользователем. Эти данные могут быть представлены в виде числовых оценок или в логическом формате «нравится-не нравится». Рейтинги широко используются в совместной фильтрации, поскольку они поддаются количественной оценке и передают положительное или отрицательное предпочтение пользователя по отношению к элементу. Одним из основных недостатков явного рейтинга является то, что его нелегко получить, и, следовательно, система рекомендаций обычно опирается на неявную обратную связь.

Многие действия пользователя, которые явно не выражены пользователем, считаются неявной обратной связью. Несмотря на то, что неявная обратная связь более доступна по сравнению с явной обратной связью, она не может дать никакой информации об отрицательных предпочтениях пользователей. Если пользователь не взаимодействовал с элементом, это не означает, что он ему не нравится.

Как неявная, так и явная обратная связь имеют свои плюсы и минусы. Выбор правильной обратной связи для вашей системы рекомендаций зависит от алгоритма машинного обучения и наличия данных.

Методы системы рекомендаций

Наиболее распространенные подходы к построению системы рекомендаций показаны на рис. 1 выше, а именно совместная фильтрация, фильтрация на основе контента и гибридный подход. Совместная фильтрация делится на подходы на основе памяти и на основе моделей. Подход, основанный на памяти, далее подразделяется на подходы, основанные на пользователях, и подходы, основанные на элементах. Когда контент и совместная фильтрация используются в системах рекоменданий, они образуют гибридную систему. Комбинация подходов на основе памяти и моделей в системе рекомендаций называется гибридным подходом в совместной фильтрации.

Фильтрация на основе содержания

Фильтрация на основе содержимого использует описания пользователей и элементов или функции для фильтрации информации и предоставления рекомендаций пользователям. Предполагается, что если пользователю нравится элемент, то другие элементы с аналогичными атрибутами также могут представлять интерес для пользователя. Простое изображение фильтрации на основе содержимого показано на рис. 2 выше. Здесь элемент A и элемент B похожи из-за их спецификации и, следовательно, сгруппированы вместе. Поскольку пользователь X предпочитал элемент A в прошлом, ему рекомендуется аналогичный элемент B. Обычно профиль пользователя создается на основе понравившихся в прошлом элементов, а затем сравнивается со спецификацией других элементов. Если сходство между профилем пользователя и конкретным элементом достаточно велико, то этот элемент рекомендуется пользователю.

Совместная фильтрация

Подход совместной фильтрации — один из самых популярных методов в рекомендательной системе. Элементы рекомендуются пользователям на основе сходства пользовательских предпочтений. Совместная фильтрация анализирует различных пользователей и их предпочтения по отношению к элементу и пытается определить корреляцию между ними. Если пользователи поставили одинаковые оценки и предпочли один и тот же набор элементов аналогичным образом, то они считаются похожими пользователями. Здесь предполагается, что если два пользователя сильно предпочитают один и тот же набор элементов, то существует высокая вероятность того, что им могут понравиться другие элементы аналогичным образом. Похожие пользователи группируются вместе, и товары, которые они предпочитают, рекомендуются друг другу. Этот метод показан на рис. 3, где элемент A и элемент B предпочтительны для обоих пользователей, пользователя X и пользователя Y, и, следовательно, считаются похожими пользователями. Теперь элемент C, который не был оценен Пользователем Y, но высоко оценен аналогичным Пользователем X, рекомендуется Пользователю Y.

Фильтрация на основе памяти и модели

Подход, основанный на памяти, можно разделить на подходы, основанные на пользователях, и подходы, основанные на элементах. В пользовательском подходе пользователи группируются на основе их предпочтений, образуя пользовательское окружение. Элемент рекомендуется пользователю, если он высоко предпочтителен пользователями в той же группе. Сходство между пользователями одной группы вычисляется с помощью корреляции между вектором рейтинга основного пользователя и других пользователей. В подходе, основанном на предметах, похожие предметы группируются вместе и образуют соседство. Пользователю рекомендуются элементы, которые находятся в той же группе, что и наиболее предпочтительный элемент.

В фильтрации на основе моделей используются алгоритмы машинного обучения, а модель обучается прогнозировать возможную оценку пользователем элемента. Одним из методов является модель скрытых факторов, которая дает рейтинг на основе скрытых факторов, выведенных из шаблона рейтинга. Одним из наиболее распространенных методов реализации модели скрытых факторов является использование матричной факторизации. Он представляет элементы и пользователей в векторном формате скрытого фактора. Матричная факторизация может использоваться как для неявной, так и для явной обратной связи.

Смешанная система рекомендаций

Гибридная рекомендательная система сочетает в себе подходы к совместной фильтрации и фильтрации на основе содержимого, чтобы рекомендовать элементы пользователям с повышенной точностью и эффективностью. Этот подход преодолевает недостатки других методов, используемых в рекомендательной системе. Например, гибридный подход решает проблему холодного запуска и разреженности совместной фильтрации, предоставляя рекомендации с использованием фильтрации на основе содержимого. С другой стороны, это также решает проблему чрезмерной специализации.

Заключение

В последние годы рекомендательные системы принесли большое количество преимуществ, таких как помощь пользователям в улучшении процессов принятия решений за меньшее время, улучшение качества обслуживания клиентов и увеличение коэффициента конверсии и доходов для онлайн-бизнеса. Избыток информации и выбор в современном цифровом мире потребовали внедрения интеллектуальной системы, которая может рекомендовать товары пользователям на основе их предпочтений, экономя время и деньги.

Системы рекомендаций имеют несколько ограничений, таких как масштабируемость, разреженность, холодный запуск и проблемы чрезмерной специализации. Эти ограничения могут привести к неточностям и плохой работе рекомендательной системы, и поэтому их необходимо тщательно обрабатывать и оценивать.