Это 4-й выпуск серии Переосмыслить метаданные… Блог.

До сих пор мы рассмотрели -

  1. Метаданные и их аспекты
  2. Актуальность метаданных
  3. Бизнес-функции, возможности и продукты

В этом выпуске мы рассмотрим Пробелы в использовании корпоративных метаданных в их текущем состоянии.

Текущие вызовы

Чтобы лучше понять проблемы, давайте сначала рассмотрим природу проблем, а затем проанализируем их влияние на бизнес.

Природа проблем

1. Метаданные предприятия фрагментированы

Объем метаданных постоянно расширяется. Термин изначально тяготел в основном к данным. Но в современном мире метаданные охватывают множество разных аспектов, как мы видели в первом эпизоде. По мере эволюции корпоративные метаданные стали изолированы узкоспециализированными продуктами, критически важными для операций. Возьмем несколько примеров —

  • Каталоги API занимают видное место в крупномасштабных службах на любом предприятии.
  • Каталоги данных содержат детали, ориентированные на данные.
  • Каталоги приложений обеспечивают жизненный цикл приложения для работы с данными.
  • Каталоги машинного обучения позволяют управлять моделями в пространстве машинного обучения.
  • Каталог объектов становится все более популярным по мере развития машинного обучения.
  • Инфра-каталоги являются основой технологического ландшафта, помогая управлять жизненным циклом систем и баз данных.

2. Глубокие связи между гранями метаданных трудно установить

Как неоднократно упоминалось в этой серии —

Метаданные предприятий современного мира — это глубокий суперграф, соединяющий людей, технологии и их жизненные циклы.

Отсутствие прочных связей между тремя сферами (люди, жизненный цикл, технологии) — мешает предприятию достичь более высокого уровня интеллекта.

3. Существующие формы интеграции не являются устойчивыми

В то время как интеграция развивается по различным аспектам метаданных, они все еще слабо связаны и недолговечны. Мы часто рассматриваем быструю интеграцию между продуктами и услугами как способ соединения точек в ориентированной на платформу экосистеме. Однако со временем эти интеграции часто имеют тенденцию быть недолговечными и исчезать по мере того, как отдельные продукты развиваются, чтобы идти в ногу со своей постоянно требовательной дорожной картой.

Давайте возьмем в качестве примера решение для Data Lineage. Чтобы эффективно передавать данные, организация должна сопоставлять детали по аспектам API, приложений, данных, классификации, машинного обучения и функций. Решение чаще всего приходит в виде интеграции метаданных или слабо связанных точек данных. Но по своей природе каждый аспект метаданных не принадлежит и не управляется одной командой или организацией. И у каждого продукта есть свои приоритеты для доставки в определенный период времени. В более длительном периоде времени мы получаем слабосвязанные системы, которые не предоставляют эффективного решения, переживающего изменения в командах, организациях и технологических стеках.

4. Отдельные аспекты систем метаданных предлагают только линейное представление своей области.

Продукты и функции в каждом аспекте метаданных предлагают очень линейное представление своей области. Чтобы действительно реализовать сценарии корпоративного использования, необходимо сопоставлять информацию по системам метаданных.

  • Каталоги машинного обучения содержат подробные сведения о спецификациях метаданных машинного обучения, но обширная информация о данных, на которые опираются модели, часто содержится в мирах каталогов функций. Еще один шаг вперед: истинные метаданные о наборах данных хранятся в каталогах данных.
  • Каталоги приложений имеют решающее значение для предприятий, ориентированных на данные. Жизненный цикл приложения данных основан на этих каталогах приложений. Однако каталоги приложений содержат мало информации о данных, которые потребляются или производятся приложениями. Для этого уровня информации необходимо перейти к Каталогам данных.
  • Каталоги API, как мы уже говорили в предыдущих эпизодах, являются ключевыми для предприятий, предоставляющих крупномасштабные услуги. Чтобы понять нисходящий поток информации от различных API и служб, необходимо объединить эту информацию с другими системами метаданных, такими как Каталог приложений, Каталог данных и Каталог машинного обучения . Это чаще всего рассматривается как Lineage.

Результирующее влияние на бизнес

1. Большую картину трудно нарисовать

Наличие корпоративного духа позволяет получить более широкое представление о ландшафте — во всех измерениях, связанных с людьми, технологиями и жизненными циклами. Сегодня нам не хватает такой возможности в сложных экосистемах. Контекст ограничен определенными полями. Вот видео, раскрывающее эту конкретную проблему.

2. Пользовательский опыт трудно адаптировать для разных персонажей.

Каждый продукт, ориентированный на метаданные, предназначен для обеспечения индивидуального взаимодействия с пользователем.

Например, взаимодействие с пользователем в каталоге ML основано на жизненном цикле домена машинного обучения. С другой стороны, каталоги API сосредоточены на управлении и эксплуатации API и сервисов. Но такое решение, как data lineage, затрагивает гораздо больше аспектов метаданных, таких как приложения, данные и машинное обучение.

Аналогичным образом, вариант использования конфиденциальности требует от пользователя взаимодействия с данными, классификацией (DLP), глоссарием и приложениями.

3. Трудно раскрыть скрытые возможности и риски

Само разделение интересов по своей природе препятствует соединению точек в Предприятии. Возьмем пример производительности. Представьте себе всплывающие рекомендации по артефактам, данным, приложениям, похожим пользователям — для нового сотрудника в организации. Это требует создания контекста, который требует глубоких связей между организацией, пользователем, приложением, данными, а затем создания сходства через контекст. С обычными решениями — рекомендации по построению — это натяжка из-за ограниченной глубины информации. И любая попытка создать решение повлечет за собой перемещение огромного количества метаданных в области приложений, пользователей, данных и т. д.

4. В текущей форме — принятие решений на основе метаданных обходится дорого.

Зрелые организации отслеживают и предоставляют комплексные решения с помощью KRI, KPI или других форм понимания. Но поскольку основное внимание уделяется операционализации отдельных стеков, отчеты о значениях и выводах становятся проблемой последней мили. Это часто передается на аутсорсинг продуктам BI, которые извлекают данные из различных систем метаданных для получения информации. Такие решения дороги в разработке, обслуживании и развитии в течение более длительного периода времени, что приводит к высокой совокупной стоимости владения.

5. Запоздалые выводы приводят к замедлению принятия решений

Часто передовые аналитические данные необходимы для принятия своевременных мер — будь то снижение рисков или повышение операционной эффективности. Из-за фрагментарного характера метаданных и их аспектов получение новой или быстрой информации невозможно. Это требование часто влечет за собой трудоемкие проекты, что приводит к длительному риску и упущенным возможностям.

Возможности

Чтобы максимизировать ценность метаданных и монетизировать их, мы должны решить основную природу проблем. Это огромная возможность оказать положительное влияние на бизнес.

Следите за обновлениями…

В следующих постах я предприму двухэтапный подход к решению основной природы проблем:

  1. Глядя на текущие характеристики системного проектирования ориентированных на метаданные или инфраструктурных продуктов.
  2. Обсуждение нового ориентированного на продукт подхода к решению проблем.