mahout для рекомендаций на основе контента

У меня есть список пользовательских данных: имя пользователя, возраст, пол, адрес, местоположение и т. д. и

набор данных о продукте: название продукта, стоимость, описание и т. д.

Теперь я хотел бы создать механизм рекомендаций, который сможет:

1 Найдите похожие товары

eg :

 name : category : cost : ingredients

 x : x1 : 15 : xx1, xx2, xx3

 y : y1 : 14 : yy1, yy2, yy3

 z : x1 : 12 : xx1, xy1

здесь x и z подобны.

2 Рекомендовать релевантные продукты из списка продуктов пользователю

Как этот вид или механизм рекомендаций можно реализовать с помощью mahout? Какие все доступные методы? Есть ли какой-нибудь полезный учебник/ссылка? Пожалуйста помоги


person Sreejithc321    schedule 19.11.2014    source источник


Ответы (1)


В mahout v1 отсюда https://github.com/apache/mahout вы можете использовать "spark-rowsimilarity ", чтобы создать индикаторы для каждого типа метаданных, категории, стоимости и ингредиентов. Это даст вам три матрицы, содержащие похожие элементы для каждого элемента на основе этих конкретных метаданных. Это даст вам рекомендацию типа «больше похожей на эту». Вы также можете попробовать объединить метаданные в одну входную матрицу и посмотреть, даст ли это лучшие результаты.

Чтобы персонализировать эту запись, какие элементы пользователь отдал предпочтение. Индексируйте матрицы индикаторов в Solr, по одному индикатору на «поле» Solr, все они привязаны к идентификатору элемента (имя?). Затем запрос представляет собой историю пользователя по каждому полю. Вы можете усилить определенные поля, чтобы увеличить их вес в рекомендациях.

Это описано на сайте Mahout: http://mahout.apache.org/users/recommender/intro-cooccurrence-spark.html И несколько слайдов здесь: http://occamsmachete.com/ml/2014/10/07/creating-a-unified-recommender-с-mahout-and-search-engine/

person pferrel    schedule 20.11.2014