Рекомендательная системная бумажная задача (2/50)

Бумажная ссылка

Почему я пишу этот блог?

Основная причина в том, что я хочу сделать некоторые заметки, чтобы в будущем я мог быстро их вспомнить, и для этого мне нужно добавить так много любимых статей. Кроме того, эта газета действительно замечательная и популярная!

Почему эта бумага?

RecSys’10 и имеет высокую цитируемость.

Кроме того, это делает огромный вклад в текущие исследования. В то время большинство исследователей применяли RMSE, чтобы рекомендовать элементы пользователям.

Однако они обнаружили, что улучшения в RMSE часто не приводят к повышению точности. Более того, они обеспечивают лучшие методы оценки и лучшие модели.

Данные?

КиноЛенс, Нетфликс

Метрика?

Отзыв и точность

Какую проблему они хотят решить? Рекомендация топ-k задач

Они применили Recall и Precision для измерения производительности, которая напрямую связана с реальным онлайн-приложением.

Какую модель они предлагают?

1. Ненормализованная окрестность косинуса

Первоначальный соседний метод — это формула (CorNgbr):

Они предложили следующую формулу (NNCosNgbr):

Они удаляют знаменатель, который нормализуется к диапазону оценок [1,5].

Первая причина заключается в том, что номер рейтинга не имеет значения для ранжирования.

Вторая причина заключается в том, что d контролирует достоверность, давая больше веса для большего количества просмотров. Таким образом, оценка разрыхления является более надежной.

Кроме того, они не используют подобие Пирсона (вычисляют только перекрывающиеся элементы). Они рассматривают косинусное сходство , принимая отсутствующее значение за 0.

2. Чистый SVD

Традиционная СВД:

Как быть с отсутствующим рейтингом?

Традиционный подход оценивает их как базовые. -› Слишком большие данные, неосуществимые.

Позже некоторые исследователи рассматривают их игнорирование и регуляризацию, чтобы избежать переобучения.

В результате есть две базовые модели:

AsySVD: представляет пользователей как комбинацию функций элемента.

SVD++: он не представляет пользователей как комбинацию функций элемента. Тем не менее, он имеет самое высокое качество в методах факторизации, оптимизированных для RMSE.

Их модель: (PureSVD)

Следовательно, r наблюдается, Q — характеристики элемента, qi — вектор целевого элемента. Эти значения мы можем легко вычислить и получить оценку.

Здесь r — это балл, а не реальный рейтинг.

Результат

Связанный:

Обзор надежных рекомендательных систем

Лучшая бумага в RecSys:

https://recsys.acm.org/best-papers/

Мой веб-сайт:

https://light0617.github.io/#/