Публикации по теме 'mahout'


Установка Hadoop и Mahout в Ubuntu 16.04 и 18.04
Após muitos testes mal sucedidos e ver diversos tutoriais incompletos, escrevo esse post para documentar o resultsado da minha pesquisa em sites e livros. É Importante Dizer Que instalação tratada aqui é uma instalação básica e support apenas o inicio de Experimentações e Testes. Чтобы установить приложение Hadoop, достаточно просто пройти через псевдо-распределенный кластер Hadoop, который не может быть выполнен в полной мере после того, как он будет использован для развития для..

Вопросы по теме 'mahout'

методология сбора данных рекомендательной системы
я создаю систему рекомендаций в своем приложении, и я, вероятно, собираюсь использовать apache mahout, я собираю большой набор данных, он будет собираться в течение определенного периода времени ... так что какой из них наименее затратный между сбором...
503 просмотров

Сопоставление пользователей с текущими данными
У меня есть база данных, полная двух разных типов пользователей (наставников и подопечных), поэтому я хочу, чтобы вторая группа (наставники) могла «искать» людей из первой группы (наставников), которые соответствуют их профилю. Наставники и...
298 просмотров
schedule 24.02.2023

Определите идентификатор документа на выводе Mahout LDA
Я успешно запустил mahout lda и отобразил вывод с помощью команды mahout ldatopics. Например, мои темы - наука и спорт. тогда вывод будет таким: тема 0 баскетбол, игра, бейсбол тема 1 исследование, учеба, философия Теперь мой вопрос заключается...
716 просмотров

Как решить проблему с рекомендацией продукта, например: Пользователь __купил__ XXX, а также __просмотрел__ YYY
В настоящее время я изучаю рекомендательную систему, узнал кое-что о совместной фильтрации, User CF, Item CF, очевидно, использовать этот алгоритм для решения таких проблем, как: 1) Пользователь купил XXX, также купил YYY 2) Пользователь просмотрел...
1742 просмотров
schedule 10.02.2024

нужен ли hadoop для запуска примеров mahout-in-action?
нужен ли hadoop для запуска примеров Mahout In Action? Я видел, что есть банка для хаупов с махаутом. У меня были проблемы с build-reuters.sh, и мне было интересно, нужна ли отдельная установка Hadoop. Спасибо!!
735 просмотров
schedule 18.08.2022

nGrams в apache mahout
Я запускаю алгоритм наивного байесовского классификатора через apache mahout. У нас есть возможность настроить размер грамма во время обучения и запуска экземпляра алгоритма. Изменение моего размера n-Gram с 1 на 2 резко меняет результирующую...
802 просмотров
schedule 31.12.2022

Как выполнить кластеризацию k-средних в mahout с векторными данными, хранящимися в формате CSV?
У меня есть файл, содержащий векторы данных, где каждая строка содержит список значений, разделенных запятыми. Мне интересно, как выполнить кластеризацию k-средних для этих данных с помощью mahout. В примере, приведенном в вики, упоминается создание...
8110 просмотров
schedule 16.12.2022

Mahout — интеграция с JPA. Нужен ли мне файл CSV?
У меня есть существующая модель данных с использованием openJPA, и я пытаюсь интегрировать систему CF с помощью Mahout. Простите меня, если это глупый вопрос, но я только начал исследовать mahout. Mahout в действии находится в почте, так что я...
278 просмотров

Как программно определить, является ли URL-адрес веб-сайта электронной коммерции или не электронной коммерции?
В проекте есть модуль, который принимает URL-адрес и определяет, является ли он веб-сайтом «Электронная торговля» или «НЕ-Электронная торговля». Я пробовал следующие подходы: Используя Apache mahout, классификация: URL-адрес ---> Возьмите...
428 просмотров

Mahout: пользователь, который купил XX, также купил XX
Я нашел похожие вопросы, но ответ меня не удовлетворил. По сути, я хотел бы реализовать в mahout предложение предметов на основе покупок (или даже рейтингов). В mahout кажется, что у вас есть модель пользовательского элемента, и рекомендация...
382 просмотров
schedule 08.05.2022

исключение при интеграции механизма рекомендаций mahout в веб-приложение Java
Я пытаюсь реализовать код recoemmender в динамическом веб-приложении Java, используя прямой подход. я могу скомпилировать код, но когда я запускаю приложение на сервере, я получаю следующую ошибку: тип отчета об исключении сообщение...
528 просмотров
schedule 22.01.2023

Использование Lucene / Mahout для поиска определяющих терминов в предопределенных группах документов
У меня есть набор документов, которые были разделены на хорошие и плохие категории. Я хочу иметь возможность предсказывать, под какую категорию попадут новые документы. Я занимаюсь поиском терминов, которые лучше всего определяют каждую категорию, и...
933 просмотров

Не удается прочитать вывод mahout PFPGrowth
Я успешно запускаю параллельный алгоритм FPGroth Apache mahout поверх Hadoop. Но сгенерированные выходные текстовые файлы не читаются, как вы можете видеть ниже....
279 просмотров
schedule 07.02.2023

Оценка рекомендателей - невозможно рекомендовать в x случаях
Я более подробно изучаю некоторые примеры кода в Mahout in Action. Я создал небольшой тест, который вычисляет среднеквадратичное значение различных алгоритмов, примененных к моим данным. Конечно, несколько параметров влияют на RMS, но я не понимаю...
1053 просмотров
schedule 12.03.2023

Mahout: Как форматировать, загружать и работать с данными для классификации?
Страница быстрого запуска JavaDocs и mahout ужасна. У меня есть копия книги Mahout in action. Я прочитал огромное количество книг Mahout in Action, в которых основное внимание уделяется форматированию данных только для систем Reccomender. Как вы...
256 просмотров
schedule 04.05.2022

Векторизация индекса solr с помощью mahout с использованием lucene.vector
Я пытаюсь запустить задание кластеризации в Amazon EMR с помощью Mahout. У меня есть индекс solr, который я загрузил на S3, и я хочу векторизовать его с помощью mahouts lucene.vector (это первый шаг в потоке работы) Параметры шага следующие:...
809 просмотров
schedule 04.01.2023

mahout не запускается. Что-нибудь сделать с совместимой версией между hadoop и mahout?
Я новичок в хаупе, а не в махауте. Я надеюсь, что кто-то может помочь мне пройти здесь.. пытался в течение 2 дней.. У меня уже есть кластер hadoop. Я использую hadoop-2.0.0-alpha. Я установил mahout (ahout-distribution-0.7) и maven-2.2.1...
4224 просмотров
schedule 26.07.2022

Как читать выходные данные кластеризации Mahout
Я запустил алгоритм кластеризации k-Means для синтетических контрольных данных из учебника Mahout, и мне было интересно, может ли кто-нибудь объяснить, как интерпретировать выходные данные. Я запустил clusterdump и получил вывод, который выглядит...
5657 просмотров
schedule 26.10.2022

Как преобразовать приведенный ниже текст в файл последовательности, который снова будет преобразован в вектор для mahout kmeans?
Добрый день всем вам, Мои данные в следующем формате: ID : VALUE(теги, назначенные пользователями) 0001: "ПК, THINKPAD, T500" 0002: "ТЕЛЕФОН, СОТОВЫЙ, IPHONE, APPLE, IPHONE5" .......и так далее. Как я могу написать код для:...
750 просмотров
schedule 14.09.2022

Как ускорить работу рекомендателя Mahout?
Привет, сообщество Mahout на SO! У меня есть пара вопросов об ускорении расчета рекомендаций. На моем сервере установлен Mahout без Hadoop. Также jRuby используется для рекомендательного скрипта. В базе данных у меня 3 тыс. пользователей и 100...
1284 просмотров
schedule 26.03.2023