Это один из простых способов рекомендовать пользователю продукты или контент. Идея здесь заключается в том, что если пользователь указывает (а), что ему нравится продукт, щелкнув, или поставив высокую оценку, или путем поиска или просмотра, это означает, что у него есть высокая вероятность того, что они купят продукт. Теперь наш подход к рекомендации продуктов будет заключаться в том, чтобы рекомендовать продукт пользователю, который имеет аналогичные атрибуты или описательные характеристики продукта, такие как марка продукта, цвет продукта, размер продукта и так далее. Обычно фильтрация на основе содержимого известна текстовыми документами, статьями и т. Д.

Шаги по рекомендации продуктов или содержимого пользователю при фильтрации на основе содержимого следующие:

  1. Определите факторы, которые описывают и дифференцируют продукты, и факторы, которые могут иметь решающее значение в зависимости от того, будет ли пользователь покупать продукт или нет,
  2. Представлять все продукты с точки зрения этих факторов, дескрипторов или атрибутов,
  3. Создайте кортеж или числовой вектор для каждого продукта, который представляет силу каждого фактора для продукта,
  4. Теперь начните смотреть на пользователей и их историю и создавать профиль пользователя на основе их истории. У него будет такое же количество факторов, и их сила будет указывать на то, насколько пользователь влияет на этот фактор,
  5. Порекомендуйте пользователю те продукты, которые ближе всего к нему с точки зрения этих факторов.

Теперь давайте рассмотрим пример рекомендации фильма на основе фильтрации контента. Теперь мы собираемся определить факторы, которые могут иметь отношение к рекомендации фильма. Этими факторами могут быть драма / комедия или реклама / искусство. Теперь мы создаем масштаб и наносим на карту все продукты в этих масштабах.

Например, предположим, что Рабин является пользователем нашей системы рекомендаций. Рабину показали 10 фильмов, и он выбрал 7 рекламных фильмов и 9 драматических фильмов. Теперь мы создали шкалу для наших факторов (-1, 1). Если фильм исключительно комедийный и коммерческий, то он имеет оценку 1, а если фильм чрезвычайно драматичен или артистичен, то оценка будет -1. Таким образом, шкала Рабина в следующем месте будет в (-0,9, 0,7).

Теперь фильмы A и B также являются драматическими и коммерческими, что означает, что фильмы и контент очень похожи. Так что разумнее порекомендовать Рабину фильмы А и Б. Такова идея фильтрации на основе контента.

Слабые стороны контентной фильтрации:

  1. Сопоставление продуктов и пользователей с факторным пространством - это ручной процесс, и получение результата потребует очень много времени,
  2. Факторы нужно подбирать вручную, а не алгоритмом, чтобы мы не смогли придумать хорошие факторы, которые отражают личность продукта.

Фильтрация на основе чистого контента не очень популярна, но она используется с другими формами систем рекомендаций для формирования гибридных и более мощных систем рекомендаций. В первый раз, когда пользователь регистрируется в приложении системы рекомендаций, мы можем спросить пользователя об его интересах, чтобы мы могли правильно рекомендовать им продукты, поскольку мы можем знать, в какое пространство факторов они могут попасть.

Если вам понравилась статья, не забудьте хлопать плюс подписывайтесь на меня в среде и в twitter. Я пишу и другие сообщения о рекомендательных системах.