Что я хочу сделать, так это суммировать значения поля во всех строках псевдонима. Это должно быть просто, но почему-то я не могу найти ответ. Вероятно, это потому, что мне нужно скалярное значение, в то время как PIG обрабатывает наборы данных? Я думаю, я могу создать строку с полем, которое является суммой? Пожалуйста, порекомендуйте!
Как вычислить сумму поля во всех строках из псевдонима
comment
Я нашел ответ, но у меня недостаточно репутации, чтобы ответить на свой вопрос через 8 часов после публикации. Я добавлю свой ответ позже сегодня вечером.
- person kee   schedule 28.03.2012
Ответы (1)
Этого можно добиться, используя GROUP ALL, чтобы объединить все в одну группу, а затем функцию SUM, чтобы сложить все поля:
DESCRIBE a
a: (name, age, height)
b = GROUP a ALL;
c = FOREACH b GENERATE SUM(a.age);
person
Chris White
schedule
27.03.2012
Точно. Вот что я нашел. Спасибо, в любом случае!
- person kee; 28.03.2012