Влияние машинного обучения и GDPR на ценность ваших данных

Все знают, что данные и мощное машинное обучение могут быть большим активом для компании, но мы по-прежнему сталкиваемся с проблемами при попытках количественно оценить потенциальную ценность при надлежащем учете связанных рисков, которые могут серьезно повлиять на истинную ожидаемую ценность. Только в 2019 году мы видели многочисленные случаи штрафов, связанных с данными, кошмаров в связи с общественностью и общих событий, подрывающих бизнес, связанных с рисками, которые не были полностью поняты и не были устранены должным образом. Положительным моментом является то, что компаниям не менее важно полностью понимать это при принятии решений относительно инвестиций, партнерства или внутренних расходов. К 2020 году руководителям необходимо усовершенствовать свое понимание оценки данных с дополнительным учетом:

  1. По мере того, как данные становятся более демократичными изнутри, количество случаев использования аналитики и машинного обучения увеличивается, и компании следует ожидать больших объемов данных, но также и увеличения уязвимостей.
  2. Экосистемы и традиционные партнерские отношения создают большую ценность и создают новые бизнес-модели, но также ставят под сомнение способность компании управлять данными и прогнозировать потенциал и риски.
  3. Правила и публичные протесты указывают на абсолютную необходимость управления данными как с чем-то, что может стать токсичным или, по крайней мере, серьезной ответственностью для компании, если меры по снижению рисков, такие как контроль конфиденциальности и прозрачность, не запланированы.

В этой статье описывается, что компания должна учитывать при оценке своей компании (на продажу или приобретение) или при определении приоритетов инвестиций. Кроме того, несмотря на традиционный взгляд на расчет ценности или рентабельности инвестиций, ценность данных и аналитики не обходится без затрат, и этот документ поможет сформулировать, что значит думать о данных как о палке о двух концах, где затраты и риски могут серьезно компенсировать любая созданная ценность.

Часть 1. Призыв сирены к сбору данных

Долгое время технологи работали над тем, чтобы убедить бизнес собирать и использовать информацию в своих данных - мы бы сказали: Данные - это актив. В течение последних нескольких десятилетий это было нормой и способствовало бурному развитию аппаратного и программного обеспечения для управления данными (например, больших данных) и прекрасной аналитики, позволяющей воспользоваться этим богатством (например, машинного обучения). И в результате компании действительно находят множество возможностей, поскольку новые услуги создают ценность повсюду, используя решения AI и ML (см. Статью Slalom по AI to ROI - ссылка). Бизнес-модели эволюционировали, и были созданы новые рынки для использования преимуществ аналитики и обширных данных о клиентах и ​​конкурентах.

Но теперь, через год после принятия Общего регламента по защите данных (GDPR) и на пороге принятия Закона Калифорнии о защите прав потребителей (CCPA), мы находимся в точке, где данные являются ОБЯЗАТЕЛЬНЫМ активом и пассивом для компании.

Подумайте об этом на минутку: компании, как правило, не могут существовать без долгов и рисков, но в последние десятилетия мы накапливали данные без риска и без учета (в значительной степени) того, что они могут сделать с компанией в случае неправильного использования. Нас беспокоили только альтернативные издержки, связанные с невыполнением конкурентного преимущества или дополнительным доходом. Обратной стороны не было, поскольку затраты на инфраструктуру и программное обеспечение продолжали резко сокращаться, а правила конфиденциальности не применялись последовательно, чтобы ограничить собираемый объем. Но это меняется ...

Часть 2 - Без бесплатного обеда

Давайте рассмотрим обновленную модель расчета стоимости на основе данных и различные способы ее создания. Тот, который объясняет сложности, растущие по мере того, как компании исследуют множество новых уровней создания ценности, и учитывает риски и затраты, связанные с владением или хранением данных.

Массачусетский технологический институт (MIT) создал схему первоначальной оценки активов (ссылку), которая определяет ценность данных как совокупность трех источников:

  1. стоимость актива или акций;
  2. ценность деятельности; и
  3. ожидаемая или будущая стоимость.

Но давайте дважды щелкните здесь и убедитесь, что наш подход «без бесплатного обеда» учитывает сложность последующего использования, а также современный взгляд на скидки и затраты. Ниже проиллюстрировано более полное и сбалансированное понимание ценности с учетом факторов 2-го порядка.

Сосредоточившись на более сложных для оценки факторах нереализованного соответствия и репутационных вычетов, важно вкратце вернуться к концепции совокупной стоимости владения (TCO).

Investopedia определяет TCO как «Общая стоимость владения отражает стоимость владения активом в долгосрочной перспективе путем оценки как его покупной цены, так и эксплуатационных затрат». Что касается сбора и технического хранения данных, но на этом сравнение с физическими активами заканчивается. Например, амортизация и другие формы учета снижения стоимости не могут моделировать ужасающие штрафы и изменения правил игры, которые могут возникнуть в результате утечки данных или публичного разоблачения того, для чего «неэтичное» использование данных может быть использовано. Кроме того, концепция токсичных активов, таких как определенные инвестиции в недвижимость, которые нельзя продать и которые представляют серьезный риск для компании, также не нашла эквивалента в бизнесе данных.

Кроме того, совокупная стоимость владения по определению ориентирована на собственные активы, но это изменилось с появлением концепции управления данными. Размытая грань между владением и управлением выходит за рамки обсуждений управления с увеличением фокус и мандаты, утверждающие, что, независимо от формы собственности (например, общество, клиент, третья сторона), любой, кто обрабатывает или касается данных, несет ответственность за их обработку. По состоянию на 2018 год GDPR и аналогичные правила относятся к холдинговым компаниям, которые владеют, хранят или обрабатывают данные.

Таким образом, более полная оценка данных должна включать следующие риски владения и управления, или даже ожидаемые и дисконтированные затраты, выраженные количественно…

  • Ожидаемая стоимость утечки данных или взлома - возникает, когда общественность узнает об утечке данных, вызванной хакерами или внутренними утечками, что приводит к огромным расходам на исправление и усилиям по восстановлению общественного доверия. В зависимости от типа информации, позволяющей установить личность (PII), и других конфиденциальных данных, которые компания хранит, каков вероятный результат взлома? Изменит ли это правила игры с точки зрения репутации бренда? Перспектива штрафов?
  • Ожидаемая стоимость публичного узнавания о ненадлежащем использовании своих данных - возникает, когда общественность узнает о том, как конфиденциальные данные используются для аналитических выводов или других действий, которые превышают явно разрешенное использование. случаи. Помимо того, что они являются камнем преткновения для GDPR и CCPA, от клиентов все чаще требуется одобрение того, как используются их данные и кому они передаются, в той мере, в какой было ясно, какую ценность представляет третья сторона. Уйдут ли клиенты или партнеры, если узнают, как компания использует их данные - насколько это будет большой проблемой? У Института Тьюринга есть интересный документ под названием Право на разумные выводы: переосмысление закона о защите данных в эпоху больших данных и искусственного интеллекта, заслуживающий рассмотрения по мере развития этой горячей темы в 2020 году (ссылка).
  • Ожидаемые расходы на штрафы от регулирующих органов за запланированные случаи несоблюдения. Имейте в виду, что многие компании приняли на себя штрафы определенного уровня как часть готовности GDPR из-за сложности и стоимости полного обновления политик, систем и средств контроля. Решение подождать, пока критический размер штрафов не вызовет необходимость действовать.
  • Нереализованные унаследованные расходы, происходящие из партнерской сети. Возникают, когда партнеры осознают штрафы или большой ущерб из-за вышеуказанных пунктов, которые становятся частично применимыми из-за совместной ответственности. Как компания Facebook реализовала с помощью Cambridge Analytica; компания, которая делится PII, несет ответственность за неправильное использование и ненадлежащее управление ее партнерами.
  • Ожидаемая стоимость публичного изучения разрыва связи с большой ценностью - возникает, когда общественность узнает о необъяснимой разнице между полученной ценностью [услугами или продуктом] и тем, что компания извлекает из собранных данных. Если компания сможет оправдать разницу из-за собственной обработки или стоимости обслуживания услуги, которую клиент или партнер сочтут подходящей, то стоимость этого мероприятия со скидкой будет низкой. Например, по данным на 2018 год Google зарабатывает примерно 182 доллара [1] на человека, исходя из рыночной капитализации (в 2017 году Facebook зарабатывал в среднем 84,41 доллара на каждого пользователя в Северной Америке и 27,26 доллара на каждого пользователя в Европе. о повторяющихся доходах от объявлений, на которые мы нажимаем). Эти цифры в 182 и 84,41 доллара, возможно, могут быть оправданы той ценностью, которую клиенты получают от услуги, но что, если компания работает с геномными данными, которые могут быть преобразованы в тысячи или миллионы биотехнологическими или фармацевтическими предприятиями посредством партнерства, что приведет к прорыву в области медицины. ?

[1] https://arkenea.com/blog/big-tech-companies-user-worth/ s?

Часть 3 - Безубыточность в "бизнесе данных"

Следуя основным бизнес-принципам, важно полностью понимать затраты и преимущества данных, чтобы понимать, выходит ли кто-то из них безубыточно или даже теряет деньги из-за своей деятельности. Прежние дни, когда данные накапливались только для того, чтобы заниматься бизнесом, даже не оценивая ценность, которую они приносят, закончились.

Дополнительная трудность заключается в том, что, как и в случае с физическими активами, стоимость данных и стоимость владения со временем меняются в зависимости от:

  • Внутреннее управление данными и зрелость конфиденциальности (способность снижать риск)
  • Внутренняя зрелость, качество и доступность данных (способность создавать ценность)
  • Внутренняя зрелость в отношении навыков и инструментов для анализа и составления отчетов с использованием данных (способность создавать ценность)
  • Общественная прозрачность, принятие и понимание того, как используются их данные (способность снижать риск)
  • И многие другие стимулирующие или зависимые факторы

В сценарии 2 ниже мы видим благоприятный сценарий, когда компания осознала ценность данных. Реализованная ценность приблизилась к своему потенциалу, И ее реализованная ценность превышает ожидаемую стоимость данных. Достигнута положительная окупаемость инвестиций.

С другой стороны, рассмотрим стартап, который искусственно поддерживается венчурным капиталом, где стоимость владения данными высока (фактические затраты и ожидаемые затраты, основанные на рисках), и они еще не начали полностью извлекать выгоду из данных. для получения дохода (сценарий 1 на рисунке 2 выше). Компании электронной коммерции, предшествующий цифровому маркетингу, были хорошим примером этого, который привел к возмутительным и неосведомленным оценкам…. что привело к катастрофе пузыря доткомов. Кроме того, относительно незрелое управление этим фиктивным стартапом может привести к неэффективному управлению использованием, обменом и контролем данных, что в какой-то момент может привести к крупным штрафам, возмущению общественности и эрозии бренда.

Хотя концепция принятия решения о переходе в «бизнес данных» носит в основном академический характер, поскольку каждая компания должна заниматься бизнесом данных, стоит изучить потенциальные альтернативные модели. Эти модели могут применяться к различным частям бизнеса или к конкретным партнерским отношениям, в которые может вступить компания. Основываясь на стратегическом взгляде компании на данные и на то, как она может создать конкурентную дифференциацию и пулы ценности для своей конкретной бизнес-модели, рассмотрите следующие модели работы с данными:

Часть 4 - Создание современной культуры данных

Тем, кто занимается сбором данных и беспокоится о рисках, описанных выше, или о том, что они не полностью осознают потенциальную ценность своих данных, на ум приходит большой вопрос - что можно сделать и с чего начать.

В конце концов, обширные операционные данные и данные о клиентах могут быть разницей между сверхвысоким ростом и прерыванием, но они могут быстро превратиться в токсичный актив, если не думать иначе о том, как управлять им в сегодняшних условиях. Серьезно относитесь к конфиденциальности и соответствию требованиям и работайте над внедрением конфиденциальности в рамках всей компании с помощью инструментов, политик, процессов и организационных изменений. В рамках этого требуется тщательный анализ и оценка того, как данные используются внутри компании, а также в сторонней и партнерской сети, и ими необходимо активно управлять.

Начните, двигайтесь осознанно и начните по-другому думать о данных и своей бизнес-модели.

Slalom - это современная консалтинговая компания, «ориентированная на цифровые и облачные технологии», которая глубоко ценит все, что данные и аналитика могут принести компании. В Кремниевой долине, а также в других наших международных офисах мы помогаем нашим клиентам привить современную культуру дэ и научиться уважать роль, которую они играют как ее владельцы и распорядители.

Интересно, что современная культура данных - это среда экспериментов, расширения возможностей, любопытства, критического мышления и сотрудничества. Компания с надлежащим управлением, контролем и сетями безопасности для защиты и подпитки этого духа, современная компания действительно может свободно исследовать и делать великие дела. Давай поговорим подробнее ...

Роберт Сибо - директор по данным и аналитике в офисе Slalom в Кремниевой долине. Поговорите с Робертом и другими руководителями отдела данных и аналитики в Slalom, связавшись напрямую или узнайте больше на slalom.com.

Роб Сибо

[email protected]

Прочие статьи о влиянии аналитики, машинного обучения, GDPR на стоимость бизнеса:

Https://podcasts.apple.com/us/podcast/the-cognitionx-podcast/id1477047194?i=1000450949563

Https://ssrn.com/abstract=3248829

Https://link.medium.com/zU7cHSNoY1

Https://sloanreview.mit.edu/article/whats-your-data-worth/

Http://analytics-magazine.org/risk-management-total-cost-of-ownership/

Https://www.mparticle.com/blog/cdp-roi-tco

Https://www.investopedia.com/terms/t/totalcostofownership.asp

Https://www.investopedia.com/tech/how-much-can-facebook-potential-make-selling-your-data/

Https://www.investopedia.com/ask/answers/120114/how-does-facebook-fb-make-money.asp

Первоначально опубликовано на https://www.linkedin.com.