Какие два разных ключа идут к одному и тому же редуктору с помощью разделителя хэшей по умолчанию в Hadoop?

Поскольку мы знаем, что Hadoop гарантирует, что одни и те же ключи, полученные от разных mappers, будут отправлены одному и тому же reducer.

Но если два разных ключа имеют одинаковое хэш-значение, они обязательно попадут в один и тот же reducer, поэтому они будут отправлены в один и тот же reduce метод упорядоченный? Какая часть отвечает за эту логику?

Большое спасибо!

java hadoop hadoop-partitioning

Judking 24.12.2013 источник

Ответы (1)

arrow_upward
2
arrow_downward

Q1:so will them be sent to the same reduce method orderly

Ответ: да

Q2:Which part is responsible for this logic

Ответ: сортировка в случайном порядке< /а>

Пример :

Допустим, номер редуктора равен 5, так что теперь.

Reduce 0 will get key NO key-value pairs
Reduce 1 will get key 1,6 in same order 
Reduce 2 will get key 2
Reduce 3 will get key 3
Reduce 4 will get key NO key-value pairs

saurabh shashank 24.12.2013

comment

Таким образом, метод сокращения будет вызываться дважды с параметрами ‹1,[2,2]› и ‹6,[20]› по отдельности? - Judking; 25.12.2013

comment

Метод Yes.Reduce будет получать только один ключ за раз. - saurabh shashank; 26.12.2013

Вопросы по теме

Сбой междоменного HTTP-запроса в AngularJS
не могу создать каталог с помощью mkdir
Почему в моем запросе не работает функция Neo4j None?
несколько растровых изображений против рисунков - влияние на производительность и память
удаление элемента в конкретном связанном списке
MongoDB: последняя запись для каждой категории по метке времени
Невероятно, но порядок просмотра раскадровки не соблюдается для представлений контейнера, исправить?
Django REST Как правильно хешировать пароль
Передача NSString между классами
Ошибка Ajax: код ответа 200
Приложение WinRT зависает при вызове BitmapDecoder.CreateAsync(stream)
Ошибка в поле выбора OpenERP версии 7
установить паруса вручную на сервер ubuntu
подстановочный знак classpath в @PropertySource
Получить и удержать вызов в twilio
Столбец автозаполнения на основе данных другого столбца
Фильтрация в пандах: исключение строк, содержащих часть строки [дубликаты]
Получить значения заголовков в ASP.NET MVC
Почему опечатка в объявлении функции Haskell приводит к тому, что GHCi выдает ошибки вокруг ранее скомпилированного кода?
как перепривязать сетку данных Silverlight