Существует так много способов создания хранилища данных, что выбор правильного пути всегда является сложной задачей. Вот ваше комплексное решение по созданию хранилища данных.

Процесс создания корпоративного хранилища данных начинается с определения его бизнес-драйверов или причин, которые мотивируют сбор информации в репозитории. Критические факторы успеха (CSF) являются производными от этих движущих сил и представляют области в среде организации, в которых могут быть внесены улучшения для повышения производительности, прибыльности и роста.

Чтобы начать создание корпоративного хранилища данных и достичь поставленных целей, вам необходимо знать, какие источники информации доступны в среде вашей организации. Эти источники могут включать корпоративные базы данных, модули онлайн-обработки транзакций (OLTP), информационные системы управления (MIS), передачи электронного обмена данными (EDI) и унаследованные системы; они также могут включать внешние источники данных, такие как аналитика финансового рынка, демографическая информация и даже настроения сотрудников.

Чтобы определить, какие типы источников информации доступны в среде вашей организации, вам необходимо выбрать концептуальную модель корпоративного хранилища данных на основе поставленных вами целей. Выбор правильной организационной модели - важное решение, требующее тщательного анализа. На выбор есть две основные модели: транзакционная или иерархическая. Эти модели могут быть расширены за счет дополнительных функций, что приведет к большему количеству гибридных реализаций EDW.

Основные различия между двумя моделями связаны с тем, как организована информация в них. В иерархической модели данные организованы в соответствии с целевым или исходным бизнес-объектом. Иерархические отношения определяются иерархией ключевых бизнес-процессов предприятия (например, продажа - ›ввод заказа -› выставление счетов), которая обычно определяет родительские / дочерние отношения между ключевыми бизнес-объектами.

Транзакционная модель содержит информацию, относящуюся к взаимосвязанным транзакциям в режиме реального времени, и ее можно легко идентифицировать как образец для непрерывных бизнес-процессов, таких как автоматизация производства, бухгалтерский учет и управление человеческими ресурсами. В этой среде каждая транзакция, которая происходит внутри организации, имеет связанный уникальный идентификатор, используемый для «связывания» данных из разных источников вместе для целей анализа и отчетности. Это позволяет связывать все события, относящиеся к одному объекту, во времени с помощью этих идентификаторов, независимо от их местоположения или формата данных.

Следующим шагом является разработка бизнес-модели для вашего EDW, которая определяет объем проекта и описывает шаги реализации для достижения успеха. Бизнес-модель должна описывать, почему вы создаете корпоративное хранилище данных в целом и в вашей организации в частности.

Хорошее место для начала обсуждения внедрения EDW - использование существующих потребностей / целей организации в качестве ключевых критериев при построении бизнес-обоснования для этого. Понимание целей вашего бизнеса поможет вам определить, какие источники информации доступны для поддержки его продвижения к достижению этих целей и как их можно использовать в среде EDW. Например, если одним из показателей эффективности вашей организации является «выход на новые рынки», могут существовать источники данных, которые повлияют на эту цель: журналы колл-центра, записи о розничных продажах или даже данные о погоде от местных государственных органов.

После того, как вы собрали и проанализировали всю доступную информацию, пора разработать стратегию хранилища данных, отражающую цели и задачи вашей организации по внедрению EDW. Потребности организации следует моделировать как можно шире, чтобы результаты анализа поддерживали текущие бизнес-инициативы. Следующие шаги помогут вам определить, какая модель лучше всего соответствует требованиям вашей компании:

* Определите, какие типы информации доступны в вашей среде (например, журналы колл-центра) и как они взаимосвязаны;

* Определите, как эти источники данных будут представлены в вашем EDW (например, в реляционной базе данных);

* Определите ключевые сущности и отношения, которые их представляют (например, счет, транзакция, заказ);

* Построить логическую модель, отражающую информационные потребности вашего бизнеса;

* Проверяйте элементы каждой диаграммы на соответствие реальным потребностям бизнеса; а также

* Произвести необходимые модификации для соответствия корпоративным стандартам. Логическая модель обычно определяется на высоком уровне, показывая только основные объекты данных и их отношения:

Этот дизайн отражает только часть полного представления организации о данных, уделяя при этом особое внимание конкретным предметным областям, наиболее соответствующим ее потребностям. Затем эти концепции используются для начала создания корпоративного репозитория, содержащего все важные данные компании, независимо от их формата или местоположения. Модель должна быть концептуально обоснованной и соответствовать детальным требованиям организации к управлению данными с точки зрения:

* Содержание данных (например, формат);

* Источники данных;

* Бизнес-правила и ограничения; а также

* Варианты реализации для каждого элемента логического дизайна. Для построения EDW можно использовать различные методы моделирования. В зависимости от целей вашей организации вы можете учитывать различные уровни сложности при принятии решения, какой из них лучше: базовый, реализованный или полный. Каждый уровень отражает свою направленность на информационные модели, которые обеспечат успешное внедрение проектов в вашей бизнес-среде:

Базовая модель. Этот тип передает основные информационные области и взаимосвязи, но не дает подробных сведений о каком-либо конкретном элементе. Он становится основой для определения того, какая информация должна быть задокументирована более подробно, или для построения более поздней версии модели с более точной информацией:

Реализованная модель. В этом типе используется более подробная документация, в которой описаны все сущности и элементы данных внутри сущности, а также их отношения:

Полная модель. Этот тип детализирует все аспекты структур и процессов вашего бизнеса, а также предоставляет дополнительные контексты, такие как отдельные лица. Модели могут использоваться на различных этапах процесса внедрения EDW для определения руководящих принципов и целей передового опыта, подходящих для каждого этапа. Вот один пример того, как эти требования могут быть адаптированы к конкретным этапам проекта на протяжении его жизненного цикла:

  • Шаг 1. Выявление целей.
  • Шаг 2 - концептуализация и выбор платформы.
  • Шаг 3. Экономическое обоснование и план проекта.
  • Шаг 4. Системный анализ и проектирование архитектуры хранилища данных.
  • Шаг 5 - Развитие и стабилизация.
  • Шаг 6 - Запуск, включая переход к производственной поддержке текущих операций. Эта методология гарантирует, что вы полностью поймете все информационные требования вашей организации, прежде чем пытаться составить полнофункциональный план внедрения. Это позволяет более точно планировать на каждом этапе разработки от концепции до завершения.

Первоначально опубликовано на https://protonautoml.com 11 июня 2021 г.