Какие два разных ключа идут к одному и тому же редуктору с помощью разделителя хэшей по умолчанию в Hadoop?

Поскольку мы знаем, что Hadoop гарантирует, что одни и те же ключи, полученные от разных mappers, будут отправлены одному и тому же reducer.

Но если два разных ключа имеют одинаковое хэш-значение, они обязательно попадут в один и тот же reducer, поэтому они будут отправлены в один и тот же reduce метод упорядоченный? Какая часть отвечает за эту логику?

Большое спасибо!


person Judking    schedule 24.12.2013    source источник


Ответы (1)