Публикации по теме 'etl-pipeline'


Почему вы должны заботиться о конвейерах ETL?
Что такое конвейер ETL? ETL означает Извлечение , Преобразование , Загрузка . Конвейер ETL — это процедура извлечения данных из одного или нескольких источников, их преобразования в соответствии с требованиями и загрузки в целевую систему (системы). Например, ETL может объединять информацию о компании с ее транзакционными данными, находящимися в разных исходных системах, и сохранять эту новую информацию в S3 в качестве целевой системы. Без конвейера ETL данные извлекаются из..

Конвейер данных Subway ETL: часть I
Краткое руководство о том, как извлекать, преобразовывать и загружать данные из википедии с помощью веб-скрейпинга и панд. Мотивация Мотивом для написания этой статьи послужил документальный фильм, который я посмотрел некоторое время назад, о том, как строились первые станции метро и что в первую очередь побудило города создать систему подземного транспорта. В то время (в 1870 году) многие считали идею создания железнодорожного метро безумной. Для них это предложение было..

Потоковая обработка и анализ данных с помощью ksqlDB
Извлечение ответов из данных с использованием возможностей потоковых конвейеров ETL — полное руководство с использованием реального набора данных Введение Потоковая передача данных — горячая тема в современном мире обработки данных. Если вы читаете посты, связанные с данными, на Medium или ищете работу в LinkedIn, возможно, вы как-то наткнулись на эту информацию. В основном это проявляется в виде требований к работе, таких как Kafka, Flink, Spark или других сложных инструментов,..