возможно ли читать данные mongodb из соединителя подключаемого модуля hadoop mongodb, обрабатывать данные с помощью mapreduce hadoop и когда результаты вывода не используют соединитель подключаемого модуля hadoop mongodb, но оставить результат mapreduce hadoop как есть, в hdfs?
коннектор mongodb hadoop - выходные данные не как mongodb, а как hdfs
Ответы (1)
Я думаю, что этот предыдущий ответ на SO отвечает на ваш вопрос с небольшим изменением:
Это можно читать данные MongoDB, обрабатывать их с помощью Hadoop и выводить в RDBS (MySQL)?
Основное отличие состоит в том, что вы должны установить для OutputFormatClass что-то вроде:
job.setOutputFormatClass( SequenceFileOutputFormat.class );
Вам также необходимо указать выходной путь в HDFS, в который вы хотите сохранить данные. См. их WordCount для полного примера кода, но используйте приведенный выше формат вывода вместо MongoOutputFormat.
person
Binary Nerd
schedule
02.04.2012
Я только что понял, что вопрос, на который я ссылался, был тем, который вы задали. Это в основном тот же вопрос с немного другим форматом вывода.
- person Binary Nerd; 02.04.2012