Механизм рекомендаций по медиа - Однопользовательская система - С чего начать

Я хочу внедрить механизм рекомендаций по медиа. Я видел похожие сообщения об этом, но я думаю, что мои требования немного отличаются от тех, поэтому публикую здесь.

Вот сделка.

Я хочу реализовать механизм рекомендаций для медиаплееров, таких как VLC, который должен заботиться только об одном пользователе. Например, он будет встроен в медиаплеер на ПК, который обычно используется одним пользователем. И он начнет изучать симпатии и антипатии пользователя и постепенно узнает, что ему нравится. Здесь он не сможет найти похожих пользователей для использования их данных для рекомендаций, так как это однопользовательская система. Итак, как это сделать?

Или вы можете рассматривать его как рекомендательный механизм, который должен быть установлен, скажем, на iPod, который должен узнавать об одном пользователе и рекомендовать музыку/фильмы из имеющихся у него коллекций.

Я думал начать собирать жанр музыки/фильмов (может быть, даже имя исполнителя), который пользователь смотрит, и рекомендовать фильмы из самого просматриваемого жанра, но это выглядит очень грубо, не так ли?

Итак, есть ли какие-либо алгоритмы, которые я могу использовать, или какие-либо ресурсы, на которые я могу ссылаться?

С уважением,

Микроядро :)




Ответы (1)


То, что вы пытаетесь сделать, довольно сложно... особенно потому, что оно все еще находится на стадии исследования, и многие доктора наук из авторитетных университетов по всему миру пытаются найти для этого хорошее решение.

Итак, вот некоторые вещи, которые могут вам понадобиться:

  1. Data that you can analyze:
    • Lots, and lots, and lots of data!
    • Это могут быть метаданные о медиа (имя, продолжительность, название, автор, стиль и т. д.)
    • Или вы можете попытаться сделать какое-то сумасшедшее извлечение функций из самого носителя.
  2. References to correlate the data to.
    • Since you can't get other users, you always need the user feedback.
    • Если вы не хотите до смерти раздражать пользователя вопросами обратной связи, подключите ваше приложение к центральному серверу, чтобы вы могли сравнивать пользователей.
  3. An algorithm that can model your data sufficiently well.

Победители приза NetFlix сказали следующее:

Точность прогнозирования существенно повышается при смешивании нескольких предикторов. Наш опыт показывает, что большинство усилий следует сосредоточить на разработке существенно различных подходов, а не на совершенствовании одной методики. Следовательно, наше решение представляет собой ансамбль многих методов.

Вывод:

Для рекомендательных систем не существует универсальной пули, и требуются годы исследований, чтобы найти хорошую комбинацию алгоритмов, дающую достаточные результаты. :)

person Kiril    schedule 07.06.2010
comment
@Microkernel, ну... скажем так, это не совсем легко сделать. - person Kiril; 08.06.2010