Публикации по теме 'data-engineering-101'


Как создать первый проект по инженерии данных? Поэтапная дорожная карта проекта
Инженерия данных 101 Как создать первый проект по инженерии данных? Поэтапная дорожная карта проекта Создавайте проекты обработки данных с помощью этого поэтапного подхода для гарантированного успеха. 16 апреля 2022 года я написал подробную Дорожную карту того, как изучить инженерию данных как новичок. Дорожная карта имела большой успех. Однако имелся существенный разрыв. Людям часто не удается сохранять последовательность, изучая так много разных технологий. Им не удается..

Демистификация форматов данных Hadoop: Avro, ORC и Parquet
Инженерия данных 101 Демистификация форматов данных Hadoop: Avro, ORC и Parquet Основные концепции и варианты использования трех форматов данных, широко используемых в Hadoop: Avro, ORC и Parquet. Если вы работаете с Hadoop, вы, вероятно, столкнетесь с ситуациями, когда вам нужно выбрать правильный формат для ваших данных. В этом сообщении блога я расскажу об основных концепциях и вариантах использования трех форматов данных, широко используемых в Hadoop: Avro, ORC и Parquet...