Использование аналитики данных для увеличения рентабельности инвестиций

Нежелание доверять и полагаться на решения, основанные на машинах, широко распространено. Это понятно; как можно быть уверенным, что автоматизированная система принятия решений учитывает все факторы, которые она должна? Сотрудники сначала изо всех сил пытаются изучить новую технологию, а затем, добившись значительного прогресса и создав многообещающую модель, лица, принимающие решения, могут по-прежнему крайне неохотно рисковать новым подходом, независимо от того, насколько хорошо тесты показывают его эффективность. Тем не менее, в сегодняшней конкурентной рабочей среде, позитивное отношение к машинам имеет важное значение для увеличения прибыли и повышения окупаемости инвестиций (ROI).

Установление базовой линии

Измерение рентабельности инвестиций включает изучение того, насколько увеличенная прибыль сравнивается с затратами. Чтобы повысить рентабельность инвестиций, вам необходимо установить базовый уровень, с которым можно сравнивать прогресс, и показатель качества (критерии заслуг). Кроме того, шокирующе, ваши текущие результаты могут не соответствовать вашим ожиданиям. Четкое понимание вашей базовой линии и метрики подскажет вам, где вы находитесь; в сочетании с пониманием бизнеса вы будете знать, куда хотите идти. После этого вы можете подумать, как туда добраться.

Выбор редактора DDI: 5 книг по машинному обучению, которые превратят вас из новичка в эксперта | На основе данных…
Бурный рост индустрии машинного обучения вызвал у людей новый интерес к искусственному ... www.datadriveninvestor.com

Аналитика данных повышает производительность во многих отношениях, главными из которых являются:

Повышение прибыли, эффективности, точности и удовлетворенности
Снижение затрат и задержек
Находить новые, лучшие возможности
Устранение некачественной практики

Машинное обучение и наука о данных могут помочь предприятиям достичь своих целей, но только в том случае, если они действительно будут реализованы. Чтобы повысить рентабельность инвестиций с помощью науки о данных, вы должны овладеть двумя совершенно разными навыками: технологией и умением убедить других доверять ей и использовать ее.

Станьте экспертом в области технологий

Изучение возможностей использования, а также сильных и слабых сторон методов анализа данных является сложной задачей для многих руководителей бизнеса. Опытные консультанты по науке о данных могут помочь тем, кто хочет применить последние разработки в области науки о данных и машинного обучения, определить хорошие проекты и их необходимые компоненты. В Elder Research нас доверяют консультантам многих крупных фирм, и мы можем выполнить первый шаг оценки готовности. Джефф Дил и Герхард Пилчер также написали книгу Mining Your Own Business, чтобы руководить менеджерами проектов интеллектуального анализа данных (data science). Кроме того, Elder Research предлагает комплексное обучение аналитике (краткосрочное и долгосрочное) и наставничество, чтобы сотрудники клиента могли развивать свои навыки работы с данными и в конечном итоге выполнять все задачи независимо.

Пример самоуправляемого автомобиля

В настоящее время вокруг искусственного интеллекта (ИИ) много шумихи, и недавние открытия - в вождении автомобилей, игре в го и покере, написании статей и т. Д. - впечатляют. Но немногие знают, что величайшие достижения ИИ зависят от науки о данных. ИИ обычно использует дедуктивный логический подход сверху вниз, в то время как наука о данных является индуктивной; он определяет новые теории (логику и уравнения) снизу вверх; то есть из примеров отдельных помеченных случаев. Оказывается, именно наука о данных ответственна за последние достижения «искусственного интеллекта». С одним только ИИ вы часто можете следовать логике, но с наукой о данных вы, вероятно, не сможете точно интерпретировать, как работает модель. В какой-то степени вы должны верить в процесс, признавая, что машина знает, что делает, когда строгие статистические тесты показывают хорошую точность на данных вне выборки.

Возможности беспилотных автомобилей постоянно растут. В марте 2018 года широко сообщаемая гибель пешехода заставила фанатов беспилотных автомобилей задуматься, но весьма вероятно, что количество аварий, предотвращаемых с помощью этой технологии, значительно превзойдет количество фактических аварий, когда-то широко использовавшихся.

Ключом к успеху на данный момент является «глубокое обучение», многослойная нейронная сеть, которая создает необъяснимые уравнения. Например, если беспилотный автомобиль поворачивает налево, это происходит из-за уравнения, которое указывает, что это лучшее действие, которое следует предпринять после просмотра огромного массива обучающих данных, состоящих из фактического вождения и решений, принятых экспертом. Уравнение, обученное на тысячах примеров, заменяет, дополняет или подтверждает логические правила ИИ.

Глубокое обучение отличается от классического ИИ. Объединение методов индуктивного моделирования из мира науки о данных и логических методов из мира искусственного интеллекта становится очень мощным.

Слияние методов

В науке о данных существует множество различных методов моделирования данных или способов «соединить точки» данных для формирования ответов. Наиболее популярны:

Регресс
Деревья решений
Нейронные сети
Ближайшие соседи
Наивный байесовский

… Но есть десятки интересных алгоритмов. Итак, что лучше? В эксперименте, который я провел со Стивеном Ли из штата Айдахо, мы обнаружили, что на тестовом наборе из шести популярных задач мы обнаружили, что нейронные сети победили в конкурсе, но все пять протестированных алгоритмов заняли 1-е место, 2-е место и минимум две проблемы. Итак, каждый алгоритм был полезен и может быть лучшим в зависимости от бизнес-задачи, которую вы пытаетесь решить, и стоит попробовать нейронные сети.

Но мы также попробовали решить эту задачу, используя четыре различных ансамблевых метода, таких как усреднение и голосование. Именно здесь вы используете все конкурирующие модели, чтобы прийти к согласованной оценке. И все четыре метода ансамбля превосходят даже лучший индивидуальный метод! Так что, даже если вы добились успеха с одной техникой, вы обязательно должны попробовать ансамбли для повышения производительности.

Рис. 1. Примеры относительной производительности: 5 алгоритмов на 6 наборах данных (со Стивеном Ли, У. Айдахо, 1997 г .; Источник)

Рис. 2. Все методы ансамбля повышают производительность (Источник)

Кроме того, если вы сравните стандартное отклонение или распространение оригинальных методов с любым ансамблевым методом, вы увидите, что ансамбли моделей намного более надежны и менее изменчивы.

Убедите людей развернуть модели науки о данных

Elder Research исполняется 25 лет, так что у нас есть большой опыт и кое-чему научились за десятилетия. В первое десятилетие технический успех наших проектов составлял 90%, но на самом деле использовались только 65% наших моделей! Нам это не понравилось, хотя исследования показывают, что только 33% проектов в области обработки и анализа данных или машинного обучения реализуются по всей стране. Мы обнаружили, что критической точкой останова являются «углеродные формы жизни»; то есть люди. Менеджеры не смогли бы на самом деле использовать порученную им тяжелую работу, даже если бы она соответствовала всем их требованиям. Что происходило?

Мы узнали, что это проблема перемен. Технология часто требует серьезных изменений в поведении людей. Под давлением и из страха выделиться среди других многие люди возвращаются к старому образу жизни вместо того, чтобы доверять модели. Мы изучили это и нашли множество способов улучшить атмосферу доверия - как технического, так и межличностного. Это окупилось; за второе десятилетие наш технический успех вырос до 98%, а успех внедрения - до 92%.

Пример Capital One

В конце 90-х, когда в Capital One было всего 100 сотрудников со степенью магистра и доктора наук, анализирующих кредитный рейтинг (последнее, что я видел много лет назад, их было ›300), они наняли Elder Research, чтобы посмотреть, могут ли новомодные методы интеллектуального анализа данных что-то добавить. Они скептически относились к тому, что небольшая универсальная компания может внести свой вклад в их основную область знаний. Я заметил разницу в ожиданиях и предложил пари: если бы мы не смогли улучшить их модели, мы бы взимали с них только половину цены, но если бы у нас получалось лучше, мы бы взимали двойную плату. Они с радостью согласились на пари.

Используя экспертное моделирование и наше не такое уж секретное оружие ансамбля, мы смогли улучшить производительность. Кредитное плечо - или увеличение прибыли даже при постепенном повышении точности - настолько велико при кредитном скоринге, что рентабельность инвестиций Capital One резко выросла, и они с радостью заплатили вдвое больше нашей цены.

Я видел, как это происходило так много раз, что по сей день мне нравится предлагать клиентам сделки, в которых они могут не платить авансом, а выплачивать только часть дополнительной прибыли после того, как это будет реализовано. Я уверен в технологиях и в нашем опыте. (Сообщите нам, если это вас заинтриговало!)

Искусство убеждения

Наука о данных - это рациональный подход к принятию решений, но люди, как правило, более иррациональны, чем мы хотели бы признать. В своей книге Думай, быстро и медленно Дэниел Канеман описывает несколько тревожных примеров того, как часто на наши суждения влияют произвольные вещи, такие как голод, недавние положительные происшествия или иррациональные ассоциации. Мы считаем неразумным, если клиенты не могут принять наши результаты, но мы поняли, что это нормально и что проблема заслуживает уважения и внимания.

Я подробнее расскажу о мягких проблемах позже, но хочу вкратце указать на разработанный мною мощный технический инструмент, который может показать, насколько надежны результаты: таргетинг целей. Перестановка целей количественно определяет вероятность того, что ваш результат мог получиться случайно. Это объясняет огромный эффект поиска, когда проверяются многие миллионы (скажем) альтернативных гипотез; нечто, также известное как p-hacking. С помощью Target shuffling вы можете извлечь реальный смысл из данных, не обманывая себя совпадениями.

Пример разведки нефти и газа

Мы использовали перестановку целей во многих реальных задачах. Один памятный фильм показал международной нефтегазодобывающей компании, как она может сэкономить миллионы долларов в год. Мы построили модели прогнозной аналитики, чтобы определить, какие из их газовых скважин в определенном регионе подвержены риску прекращения добычи (например, из-за замерзания надземных линий или засорения подземных линий). Они хотели узнать об этом за 4–6 месяцев заранее, чтобы определить приоритетность профилактического обслуживания и наилучшим образом использовать свой ценный персонал и ресурсы для технического обслуживания. Благодаря огромному усердию и опыту мои коллеги смогли спрогнозировать потребность в техническом обслуживании в 3 раза лучше, чем их базовый метод. Таким образом, без дополнительных затрат на персонал или машины они могли бы вернуть десятки миллионов долларов газа, просто направив свой персонал в соответствии с нашими моделями. Перетасовка целей показала, что этот результат был настолько надежным и значительным, что вероятность того, что это была удача, составляла лишь 1/2 500. И, если бы они могли сократить свое окно принятия решений на месяц или два, экономия резко увеличилась бы за счет повышения точности.

Реальность такова, что компании во многих отраслях могут добиться огромных успехов, извлекая полезную информацию из своих данных. Это требует доверия и некоторого терпения, но Elder Research может принести доказанные результаты, как правило, всего в течение нескольких месяцев. Мы определяем базовые показатели и бизнес-показатели, собираем данные и преобразуем их в ценную информацию, чтобы помочь вам принимать более обоснованные решения, которые обеспечат невероятную рентабельность инвестиций и могут трансформировать ваш бизнес.

Нужна помощь в начале работы с аналитикой? На полдневной сессии Elder Research по стратегии исполнительной стратегии в области аналитики представлены стратегии использования аналитики для улучшения процесса принятия решений в организации и даны рекомендации о том, как расширить свои аналитические возможности. Узнать больше.

Связанный

Может ли аналитика данных действительно обеспечить рентабельность инвестиций 1300%? Почему важна информационная грамотность в C-Suite Шумиха или реальность: окупаемость машинного обучения

Первоначально опубликовано на https://www.elderresearch.com.