Я хочу эффективно отсортировать большой набор данных (т.е. с помощью специального разделителя, как описано здесь: Как работает алгоритм сортировки MapReduce?), но я хочу сделать это с помощью hive.
Однако в руководстве по Hive указано, что «заказ по» выполняется одним редуктором. Это меня удивляет, поскольку в pig действительно реализовано нечто похожее на статью - pig impl
Мне что-то не хватает, или улей просто не подходит для этой работы?