В этом примере показано, как создать набор данных Spark поверх рабочего пространства GoodData. Когда у вас есть данные в наборе данных Spark, вы можете использовать все возможности Spark для обработки данных, включая преобразование данных, машинное обучение и т. д.
Набор данных использует рабочую область, созданную в этом руководстве.
Настраивать
В примере требуется файл конфигурации .gooddata
, расположенный в вашем домашнем каталоге. Файл имеет такую структуру:
{
"host": "<your-gd-domain>.na.gooddata.com",
"username": "<your-gd-username>",
"password": "<your-gd-password>",
"workspace":"<your-gd-workspace-id>"
}
Код
Ознакомьтесь с примером кода
Учебники и статьи
- Мотивация: SQL и агрегированные данные: есть ли способ лучше?
- Доступ к рабочему пространству GoodData из ноутбука Apache Zeppelin
- Учебное пособие по доступу к рабочему пространству GoodData из консоли Beaver JDBC