Публикации по теме 'data-architecture'


Мой путь к сертифицированной AWS специальности Data Analytics: ретроспективный взгляд
Введение Два года назад я успешно сдал экзамен по специальности AWS Certified Data Analytics. В этой статье я хочу поделиться своим опытом и дать несколько советов и идей, которые могут быть полезны тем, кто готовится к экзамену. Предпосылки для экзамена Настоятельно рекомендуется пройти сертификацию AWS Solutions Architect Associate или Professional, прежде чем пытаться сдать специальный экзамен AWS Certified Data Analytics. Это обеспечивает прочную основу для платформы AWS и ее..

Типы архитектуры платформы данных
Насколько хорошо это отвечает потребностям вашего бизнеса? Дилемма выбора. Легко заблудиться в изобилии инструментов обработки данных, доступных на рынке прямо сейчас. В Интернете полно самоуверенных историй (часто спекулятивных) о том, какие инструменты данных использовать и как сделать наш стек данных современным в этом конкретном году . Какие инструменты обработки данных лучше всего? Кто лидер? Как выбрать правильные? Эта история для тех, кто находится в «космосе» и строит..

Модульный поиск данных (для машинного обучения и др.), введение
Усвойте эту ключевую концепцию для хранилищ функций и платформ виртуализации данных. Появляется все больше инструментов, упрощающих процесс создания наборов данных. Существуют хранилища функций для машинного обучения, платформы виртуализации данных для бизнес-аналитики и облачные концентраторы данных для всего, что только можно вообразить. Все эти инструменты создают необходимый промежуточный уровень между пользователем, потребляющим данные в виде наборов данных, и инженерами, которые..

От хранилищ данных и озер к сетке данных: руководство по корпоративной архитектуре данных
Понять, как работают данные в крупных компаниях Существует разрыв между курсами по науке о данных и реальностью работы с данными в реальном мире. Когда полдесятилетия назад я получил свою первую работу аналитика в одном из австралийских банков «Большой четверки», я столкнулся со сложным ландшафтом данных, характеризующимся… Проблемы с поиском , доступом и использованием данных; Конкурирующие приоритеты бизнеса, тянущие людей в разные стороны; Устаревшие системы, которые..

Зачем синтезировать данные?
Хранение огромных объемов данных сопряжено со своими рисками и проблемами. Синтетические данные — это один из вариантов инструментария для их решения. В этой статье рассматриваются различные аспекты, в том числе конфиденциальность данных, сохранение и деидентификация. Данные переписи недостоверны. Есть несколько причин; отсутствующие данные, трудности с классификацией, ошибочные, неправильно представленные данные и другие. Помимо этих проблем, нормативные требования обеспечивают..