Вопросы по теме 'scalding'

Чтение из HBase с обвариванием
Я очень новичок в Cascading/Scalding и не могу понять, как горячо читать данные из HBase. У меня есть таблица в HBase, где хранится история рук в покерных играх (очень простым способом: id -> hand, serialized with ProtoBuf ). Задание ниже...
779 просмотров
schedule 02.05.2023

преобразование из родного формата матрицы, обваривание
Итак, этот вопрос связан с вопросом Преобразование матричного формата, ошпаривание Но теперь я хочу сделать операцию на спине. Итак, я могу сделать это таким образом: Tsv(in, ('row, 'col, 'v)) .read .groupBy('row) {...
190 просмотров
schedule 19.05.2022

Обвар+ЛЗО+Протобуф
Есть ли какие-либо указания, чтобы заставить Scalding работать с данными LZO Protobuf в HDFS? Я пытаюсь прочитать файлы, которые хранятся в двоичном Protobuf и сжаты в LZO с помощью Scalding. Можем ли мы использовать Elephantbird для чтения этих...
564 просмотров
schedule 10.04.2022

ошпаривание NoClassDefFoundError
после установки java, scala scalding на OSX у меня возникает следующая ошибка, когда я пытаюсь запустить файл WordCountJob $ scripts/scald.rb --local WordCountJob.scala --input someInputfile.txt --output ./someOutputFile.tsv компиляция...
453 просмотров
schedule 03.11.2023

Как войти в файл в Scalding?
В моем коде сокращения карты Scalding я хочу отключить определенные шаги, которые происходят, чтобы я мог отлаживать задания сокращения карты, если что-то пойдет не так. Как я могу добавить ведение журнала в свою работу по ошпариванию? E.g....
506 просмотров
schedule 04.04.2023

Scala/Scalding: сводные данные
У меня есть набор данных, который является результатом ошпаривания трубы, который выглядит так: 'Var1, 'Var2, 'Var3, 'Var4 = a,x,1,2 a,y,3,4 b,x,1,2 b,y,3,4 Я пытаюсь превратить это во что-то вроде: 'Var1, 'Var3x, 'Var4x, 'Var3y,...
495 просмотров
schedule 28.03.2023

(Scalding) groupBy foldLeft с помощью группировки по значению в фолде
Имейте такие данные, как: pid recom-pid 1 1 1 2 1 3 2 1 2 2 2 4 2 5 Нужно сделать: pid, recommendations 1 2,3 2 1,4,5 Это означает игнорировать себя из 2-го столбца и вводить остальные в строку, разделенную...
1829 просмотров
schedule 12.01.2023

цикл по значениям в richPipe: ошпаривание
Я пытаюсь решить проблему, когда мне приходится перебирать все значения в канале. Чтобы смоделировать мою проблему, я объясню пример проблемы. Input file : number 1 2 3 4 Output should be number sumOfSmaller...
284 просмотров
schedule 22.01.2023

mutable.Buffer не работает с Scalding JobTest for Type Safe API
Я почти закончил свой проект Scalding, который использует Type Safe API вместо Fields API. Последняя проблема, которая остается для меня в общей настройке проекта, — это интеграционные тесты всего задания Scalding (я закончил модульные тесты для...
194 просмотров

Как посчитать частоту столбцов в строке в typedpipe в scalding?
В настоящее время я работаю над заданием mapreduce, используя ошпаривание. Я пытаюсь установить порог, основываясь на том, сколько раз я вижу определенное значение среди строк в моем typedpipe. Например, если бы у меня были эти строки в моей...
437 просмотров
schedule 17.07.2022