Вопросы по теме 'scalding'
Чтение из HBase с обвариванием
Я очень новичок в Cascading/Scalding и не могу понять, как горячо читать данные из HBase.
У меня есть таблица в HBase, где хранится история рук в покерных играх (очень простым способом: id -> hand, serialized with ProtoBuf ). Задание ниже...
779 просмотров
schedule
02.05.2023
преобразование из родного формата матрицы, обваривание
Итак, этот вопрос связан с вопросом Преобразование матричного формата, ошпаривание
Но теперь я хочу сделать операцию на спине. Итак, я могу сделать это таким образом:
Tsv(in, ('row, 'col, 'v))
.read
.groupBy('row) {...
190 просмотров
schedule
19.05.2022
Обвар+ЛЗО+Протобуф
Есть ли какие-либо указания, чтобы заставить Scalding работать с данными LZO Protobuf в HDFS?
Я пытаюсь прочитать файлы, которые хранятся в двоичном Protobuf и сжаты в LZO с помощью Scalding. Можем ли мы использовать Elephantbird для чтения этих...
564 просмотров
schedule
10.04.2022
ошпаривание NoClassDefFoundError
после установки java, scala scalding на OSX у меня возникает следующая ошибка, когда я пытаюсь запустить файл WordCountJob
$ scripts/scald.rb --local WordCountJob.scala --input someInputfile.txt --output ./someOutputFile.tsv
компиляция...
453 просмотров
schedule
03.11.2023
Как войти в файл в Scalding?
В моем коде сокращения карты Scalding я хочу отключить определенные шаги, которые происходят, чтобы я мог отлаживать задания сокращения карты, если что-то пойдет не так.
Как я могу добавить ведение журнала в свою работу по ошпариванию?
E.g....
506 просмотров
schedule
04.04.2023
Scala/Scalding: сводные данные
У меня есть набор данных, который является результатом ошпаривания трубы, который выглядит так:
'Var1, 'Var2, 'Var3, 'Var4 =
a,x,1,2
a,y,3,4
b,x,1,2
b,y,3,4
Я пытаюсь превратить это во что-то вроде:
'Var1, 'Var3x, 'Var4x, 'Var3y,...
495 просмотров
schedule
28.03.2023
(Scalding) groupBy foldLeft с помощью группировки по значению в фолде
Имейте такие данные, как:
pid recom-pid
1 1
1 2
1 3
2 1
2 2
2 4
2 5
Нужно сделать:
pid, recommendations
1 2,3
2 1,4,5
Это означает игнорировать себя из 2-го столбца и вводить остальные в строку, разделенную...
1829 просмотров
schedule
12.01.2023
цикл по значениям в richPipe: ошпаривание
Я пытаюсь решить проблему, когда мне приходится перебирать все значения в канале. Чтобы смоделировать мою проблему, я объясню пример проблемы.
Input file :
number
1
2
3
4
Output should be
number sumOfSmaller...
284 просмотров
schedule
22.01.2023
mutable.Buffer не работает с Scalding JobTest for Type Safe API
Я почти закончил свой проект Scalding, который использует Type Safe API вместо Fields API. Последняя проблема, которая остается для меня в общей настройке проекта, — это интеграционные тесты всего задания Scalding (я закончил модульные тесты для...
194 просмотров
schedule
04.06.2024
Как посчитать частоту столбцов в строке в typedpipe в scalding?
В настоящее время я работаю над заданием mapreduce, используя ошпаривание. Я пытаюсь установить порог, основываясь на том, сколько раз я вижу определенное значение среди строк в моем typedpipe. Например, если бы у меня были эти строки в моей...
437 просмотров
schedule
17.07.2022