Найдите путь к jar-файлу hadoop-streaming-1.2.1.jar в файловой платформе Google.
https://github.com/devangpatel01/TF-IDF-implementation-using-map-reduce-Hadoop-python-
Я пытаюсь запустить этот mapreduce на GCP с помощью Hadoop, но не могу найти путь к hadoop-streaming-1.2.1.jar. Я попытался загрузить файл jar вручную и загрузить его в hadoop, а затем запустить mapper1.py. Но я получаю сообщение об ошибке, говоря, что путь неверен. Вышеупомянутая программа была запущена на локальной машине. Как отредактировать команду, чтобы запустить ее на GCP?
jar-файла /home/kirthyodackal/hadoop-streaming-1.2.1.jar -input hdfs://cluster-29-m/input_prgs/input_prgs/input1/000000_0 -output hdfs://cluster-29-m/input_prgs/input_prgs /output1 -mapper hdfs://cluster-29-m/input_prgs/input_prgs/mapper1.py -reducer hdfs://cluster-29-m/input_prgs/input_prgs/reducer1.py