Многие процессы управления данными, изначально созданные как защитные меры, обусловленные нормативными требованиями, теперь переназначаются и совершенствуются для поддержки наступательных стратегий, связанных с машинным обучением и искусственным интеллектом.

Необходимое зло

Различные отрасли созрели для понимания и уважения к управлению данными с разной скоростью. Справедливости ради стоит сказать, что финансовые услуги и страховые отрасли, долгое время движимые сбором и анализом подробной информации [вспомните актуарные таблицы и отметки на глиняных табличках], являются одними из старейших практиков этой функции. Регуляторные требования, введенные после краха 2008 года, активно продвигали эти программы в последние годы.

В этом контексте многие из политик и процедур, которые мы сейчас считаем частью современного управления данными, были созданы на оборонительной основе. Руководители корпораций, особенно те, кто лично не занимается технологической стороной своих организаций, считали управление дорогостоящим необходимым злом в ответ на требования регулирующих органов. Атрибуты этих программ были тесно связаны с конкретными требованиями, определенными соответствующими правилами, и вся совокупность рассматривалась — многие неохотно — как центр затрат.

Прочный фундамент, на котором можно строить

Это просто прекрасно, и есть много похвальных частей нашей работы, которые мы воспринимаем просто как расходы на ведение бизнеса. Те из нас, кто находится в окопах решения проблем на крупных, богатых данными предприятиях, особенно те, которые имеют обширные портфолио исторического контента, давно осознали, что в юрисдикции управления данными лежат многие ключи к успеху в снабжении информацией. цепочка по всей фирме. Как Эрик Аранов [ https://www.linkedin.com/in/eric-aranow-3ab34b/ ] приложил столько усилий, чтобы научить меня за последний год, если ваши данные не наделены социализированными, нормализованными, домен-специфический смысл, вы в основном нигде. Несколько других способов, в которых функции, часто связанные с управлением данными, являются ключевыми, включают:

  • Создание централизованного словаря для семантических терминов предметной области и сопоставление всех элементов данных, поступающих из систем записи и внешних источников, с этими значениями.
  • Создание таксономий и/или онтологий, предоставляющих элементам данных самореферентный контекст.
  • Определение стандартной методологии и структуры для курирования данных, а также четкие ожидания относительно «атрибутов курирования» каждого набора данных, доступного для использования.
  • Централизованная документация о том, какие активы данных доступны, а также об их происхождении.
  • Некоторая система подписки, чтобы менеджеры данных могли понять, кто их потребляет и для чего. Это сцепление, когда исходные данные необходимо изменить, а связанные с ними последующие воздействия должны быть определены и смягчены.
  • Строгие правила в отношении источников данных, которые будут использоваться для принятия бизнес-решений, а также передачи этих данных дополнительным потребителям.

«Если ваши данные не наделены социализированным, нормализованным, специфичным для предметной области значением, вы практически нигде».

Кормление зверей машинного обучения и искусственного интеллекта

Дети 1980-х годов знают, что среди повторяющихся тем фильмов той эпохи была притча о желтоцвете, который внезапно стал популярным. Внезапно управление данными оказывается главным героем фильма Джона Хьюза. Среди новейших наступательных систем, доступных для крупных глобальных предприятий, — машинное обучение [ML] и искусственный интеллект [AI]. ДА, мы можем поспорить о том факте, что ML существует почти с тех пор, как первый программист устал писать код для управления каждой перестановкой своего приложения, а также о том, что 80% современных вариантов использования обычно определяются как « искусственный интеллект» далеки от строгого академического определения этой способности. Но это не меняет того факта, что последние технологические и организационные достижения привлекли к этим возможностям внимание руководителей высшего звена, которые активно инвестируют, чтобы максимально использовать свои потенциальные преимущества для получения прибыли. Это все «наступательная» стратегия — использование новых инструментов для создания рыночной дифференциации и/или извлечения большей ценности из существующих активов данных, чем у конкурентов. И вот тут история возвращается к управлению данными.

«Внезапно управление данными оказывается главным героем фильма Джона Хьюза».

Одна из первых вещей, которую эти фирмы узнают в своих экспериментах с машинным обучением и искусственным интеллектом, заключается в том, что эти технологии процветают благодаря постоянному потоку первозданных данных. Базы знаний, которые эти системы используют для решения сложных проблем, должны быть сначала созданы и обеспечены путем прямого синтеза обширного и глубокого портфеля известных данных. Чтобы понять, что здесь имеется в виду под термином «известный», вернитесь к приведенному выше маркированному списку, связанному с функциями управления данными.

В своем энтузиазме по поводу обещаний машинного обучения и искусственного интеллекта [реальных и/или предполагаемых] многие корпоративные лидеры, которые раньше держали управление данными на голодной диете, возвращаются назад, принося подарки тем же самым функциям в своих организациях. Они могут не совсем хорошо понимать детали, связанные с поддержанием чистоты и надлежащего управления корпоративными данными, но они усвоили, что это является необходимым условием для использования машинного обучения и искусственного интеллекта для достижения своих бизнес-целей. И этого достаточно, чтобы они стали усилителями голоса.

Вы никогда не оденетесь полностью без улыбки

Можно извинить специалистов по долгосрочному управлению данными за скептическое закатывание глаз по поводу их новообретенной популярности. Добро пожаловать в клуб «центр прибыли». Но они не должны позволять этим эмоциям мешать им извлечь выгоду из возможности, которую представляет этот сценарий. В конце концов, нашей целью всегда было создание и развертывание наиболее качественных и легкодоступных ресурсов данных на предприятии. Тот факт, что финансирование для осуществления этих мечтаний внезапно поступает от папы Уорбакса и его вновь обретенного увлечения Хэлом 9000, не исключает того факта, что мы все в одной команде, и благодаря этой деятельности мы обслуживаем наши собственные цели. .

Эффективное управление данными всегда было «правильным делом», и глубоко укоренившаяся философия на этот счет долгое время была секретным рецептом многих эффективных современных предприятий. В то время как их конкуренты постоянно сжимали функцию управления финансированием в ответ на давление рынка, эти эффективные компании спокойно признавали управление корневой системой, поддерживающей каждую восходящую ветвь и лист их растущих предприятий, и добросовестно инвестировали.

Внезапно благодаря обещаниям машинного обучения и искусственного интеллекта даже менее осведомленные организации обращаются к вере в управление данными. Те из нас, кто занимается управлением данными, должны приветствовать их с распростертыми объятиями, предоставить им почетных карманных защитников и максимально использовать возможности, которые это представляет для блага ценных данных в наших корпоративных портфелях. Наши пятнадцать минут истекут, прежде чем мы это осознаем.