Используя Hue, у меня есть запрос Hive, который будет принимать входные данные (например, идентификационный номер) и возвращать запись на основе этого. Мне нужно обрабатывать несколько чисел, чтобы искать за один раз (последовательно или параллельно) и сопоставлять результаты (т.е. перечислять записи для каждого, одну за другой), поэтому ввод может быть:
1234567890
45345353
32423422
1323122
etc...
У меня есть доступ к Hue (который я должен использовать), Hive, Oozie и Beeline. Как я:
1.) извлеките номер для каждой строки
2.) неоднократно вызывать мой запрос HiveQL, передавая каждое число по очереди
3.) предоставить пользователю общий результат за один раз
Я не знаю Python, если это актуально, но могу попробовать сценарий оболочки.
Я предполагаю, что одним из способов может быть получение многострочного пользовательского ввода через Oozie (может ли он запрашивать ввод у пользователя?), А затем передать его в сценарий оболочки, который извлекает номер из каждой строки и использует beeline для повторного запуска моего Запрос Hive со следующим номером в качестве параметра?
Спасибо