Можно включить задачу Fetch в Hive для простого запроса вместо Map или MapReduce с помощью параметра hive hive.fetch.task.conversion
.
Пожалуйста, объясните, почему задача Fetch выполняется намного быстрее, чем Map, особенно при выполнении простой работы (например, select * from table limit 10;
)? Какая задача, относящаяся только к карте, дополнительно выполняется в этом случае? В моем случае разница в производительности больше, чем в 20 раз. Обе задачи должны читать данные таблицы, не так ли?