Это один из самых частых вопросов, который задают многие специалисты по данным!! Ответ заключается во многих факторах, но в этой статье мы рассмотрим некоторые ключевые факторы, которые помогут нам оценить правильное решение.

Ниже приведены некоторые ключевые факторы, которые нам необходимо учитывать, прежде чем выбрать какое-либо решение.

размер собираемых данных , разнообразие форматов данных и типов , скорость , с которой данные генерируются, производятся , создано или обновлено , качество и точность данных , какую ценность организация получит от анализа данных и людейнепосредственно или косвенное использование данных

Унифицированная архитектура для хранилища данных, озера данных и хранилища данных

Ниже представлена ​​унифицированная архитектура данных, которая охватывает три подхода к реализации решения платформы данных для различных нужд.

Теперь давайте рассмотрим каждое решение и посмотрим, для чего оно подходит.

Заключение:-
Традиционное хранилище данных: для бизнес-аналитики (BI)
Озеро данных: для бизнес-аналитики (BI), науки о данных и машинного обучения (две отдельные платформы данных)
Озеро данных : для бизнес-аналитики (BI), потоковой аналитики, науки о данных и машинного обучения (унифицированная платформа данных).

В этой статье я описал несколько ключевых моментов при выборе подходящего решения для платформы данных, но их очень много, на что следует обратить внимание в зависимости от вашей стратегии организации и дорожной карты.

Я надеюсь, что эта статья будет информативной, увидимся в моей следующей статье, а пока отлично проведите время и наслаждайтесь жаркой погодой.