Работает ли mahout в реальном времени или предварительно обрабатывает данные на основе правил алгоритма?

Я пытаюсь создать механизм рекомендаций, для этого я думаю об использовании apache mahout, но я не могу понять, обрабатывает ли mahout данные в режиме реального времени или предварительно обрабатывает данные, когда сервер простаивает, и сохраняет результаты где-то в базе.

Также кто-нибудь знает, какому подходу следуют такие сайты, как amazon, netflix?


person Y0gesh Gupta    schedule 20.05.2013    source источник


Ответы (1)


Либо/или, но не оба. Внутри есть части из более старого проекта, которые, по сути, в реальном времени для среднего масштаба. Существуют также реализации на основе Hadoop, которые все находятся в автономном режиме. Эти два не связаны.

Я являюсь основным создателем этих частей, и если вам нужна система, которая сочетает в себе и то, и другое, я предлагаю вам взглянуть на мой текущий проект Myrrix (http://myrrix.com)

person Sean Owen    schedule 20.05.2013
comment
Итак, вы имеете в виду, что мы можем либо обрабатывать данные в режиме реального времени, либо предварительно обрабатывать данные и использовать результат впоследствии, но не оба в mahout. P.S. Какой будет лучший подход, если мы хотим минимизировать время для отображения результата, а пространство не является проблемой. - person Y0gesh Gupta; 21.05.2013