В этом примере показано, как создать набор данных Spark поверх рабочего пространства GoodData. Когда у вас есть данные в наборе данных Spark, вы можете использовать все возможности Spark для обработки данных, включая преобразование данных, машинное обучение и т. д.

Набор данных использует рабочую область, созданную в этом руководстве.

Настраивать

В примере требуется файл конфигурации .gooddata, расположенный в вашем домашнем каталоге. Файл имеет такую ​​структуру:

{ 
   "host": "<your-gd-domain>.na.gooddata.com",
   "username": "<your-gd-username>",
   "password": "<your-gd-password>",
   "workspace":"<your-gd-workspace-id>"
}

Код

Ознакомьтесь с примером кода

Учебники и статьи

Первоначально опубликовано на https://github.com.