Авторы ПКС Пракаш и Арун Шастри
Прогнозирование является критически важной потребностью для многих функций в каждой отрасли, и его основная цель - минимизировать неопределенности, связанные с процессом планирования. Например, прогнозирование ожидаемых продаж или доли рынка используется для планирования и контроля производственного процесса. Традиционные подходы к прогнозированию включают основанные на тенденциях или статистические методы, однако ландшафт прогнозирования значительно меняется сейчас, когда алгоритмы ИИ начинают использоваться в сочетании для определения прогнозов. При использовании в сочетании со статистическими методами они помогают повысить точность. Как? Лучшие статистические подходы извлекают тенденции и сезонность и используют ИИ для получения любой информации из оставшихся компонентов, не объясняемой статистическим подходом.
Если вы все же решите включить ИИ в свои модели прогнозирования, следует учитывать три ключевых аспекта:
- Точность. Какова эффективность вашей модели искусственного интеллекта и каков правильный показатель для оценки прогноза?
- Гибкость. Насколько гибка ваша система искусственного интеллекта при адаптации к изменениям в окружающей среде?
- Интерпретируемость. Почему ваша модель искусственного интеллекта меняет прогноз? Что побуждает к предлагаемым изменениям прогноза?
Точность
На производительность ИИ влияет то, как оценивается ИИ и какая точность достигается при задержке (или «тестировании») данных. Есть несколько способов оценить точность решения AI в парадигме прогнозирования. Вот три полезных показателя ошибок, которые помогут оценить точность модели:
- Ошибки, зависящие от шкалы: показатели ошибок, зависящие от шкалы, такие как средняя абсолютная ошибка (MAE) и среднеквадратичная ошибка (MSE), являются общими оценками. Эти показатели полезны для понимания величины ошибки в серии. Однако, учитывая, что эти меры имеют тот же масштаб, что и данные, эти метрики не имеют ценности для доступа к точности нескольких рядов.
- Ошибки в процентах: средняя абсолютная ошибка в процентах (MAPE) является таким примером и также широко используется при прогнозировании. MAPE действительно хорошо работает на более высоких уровнях, например, в прогнозах на национальном уровне; однако MAPE имеет тенденцию искажаться, когда фактические значения приближаются к нулю. (Другие варианты, такие как sMAPE или MASE, могут обрабатывать асимметрию или асимметрию.)
- Относительные ошибки. Этот показатель разделяет ошибку прогнозирования на ошибку базового уровня, чтобы сделать ее масштабной. (Например, относительная ошибка (t) = e (t) / e * (t), где e * (t) - ошибка от базового уровня.) Однако в случаях, когда ожидается прерывистый спрос, например, в запускаемых продуктах, эти показатели не так надежны, поскольку ошибки базового плана близки к нулю.
Определение неопределенности или интервалов прогнозирования для точечных оценок - это другая половина головоломки, связанной с точностью. Чем точнее решение, тем меньше интервал предсказания, указывающий на более высокую достоверность предсказания. Это оценивается с помощью средней шкалы интервалов (MSIS).
Чтобы получить правильные прогнозы, нужно поэкспериментировать, чтобы получить правильный выбор модели. Во многих фармацевтических компаниях прогнозирование - это трудоемкое занятие, проводимое членскими организациями страны, часто подверженными индивидуальным предубеждениям. Автоматизация прогнозов может повысить точность и гибкость процесса. В ходе недавнего взаимодействия с фармацевтическими компаниями, переходящего с национального уровня на уровень дистрибьютора, заводские прогнозы повысили точность прогнозов примерно на 4%. Точно так же добавление внешних переменных для заводского прогноза показало среднее улучшение примерно на 6%.
Ловкость
Другая большая ценность, которую ИИ и машинное обучение (AI / ML) привносят в прогнозирование, - это способность распознавать и быстро реагировать на изменения в окружающей среде, процессе прогнозирования или данных. Система AI / ML может помочь контролировать состояние прогнозов в режиме реального времени, отслеживая события, которые потенциально могут повлиять на прогноз. Три ключевых момента для достижения гибкости включают в себя:
- Данные. Для гибкости требуется централизованное озеро данных или аналогичная структура для своевременного обновления данных. Если используются причинно-следственные модели, это могут быть данные на основе тенденций и времени или внешние факторы, такие как праздники, количество рабочих дней или прогнозы погоды.
- Технология. Любая гибкая установка AI / ML должна поддерживаться соответствующим технологическим стеком, который принимает данные, облегчает моделирование и оценку и, наконец, увеличивает потребление. Некоторые из последних технологий, используемых в различных отраслях, включают озера данных, облачные вычисления, кластеры или графические процессоры для вычислений, языки программирования, такие как python или R, для моделирования, контроль версий для интеграции и платформы визуализации для отчетов о результатах.
- Алгоритм. Разработка, развертывание и управление - три ключевых элемента использования алгоритмов для достижения гибкости. Компонент разработки гарантирует, что проблема решена правильно и оценивается с использованием соответствующих показателей точности. Развертывание обеспечивает автоматизацию процесса прогнозирования и гарантирует, что процесс может выполняться автоматически в пределах определенного временного разрешения. Управление моделью обеспечивает правильную работу алгоритма с течением времени с помощью процессов контроля качества, таких как проверка данных, и ключевых показателей эффективности модели, таких как показатели точности.
Интерпретируемость
Интерпретируемость - это описание ИИ / машинного обучения понятным людям способом. Чтобы повысить точность моделей, модели машинного обучения переходят на нелинейные классификаторы, такие как архитектуры глубокого обучения и ансамблевые методы. Эти подходы напоминают черный ящик, что затрудняет интерпретацию. Чтобы система была интерпретируемой, она должна выдавать выходные данные, понятные пользователям. Следовательно, это связано с познанием, знаниями и предвзятостью пользователей. Эта зависимость от людей может сделать прозрачную систему AI / ML убедительной. Для улучшения интерпретируемости модели может быть несколько уровней:
- Интерпретируемость модели: основное внимание уделяется тому, как алгоритм учился на основе заданных данных. Например, дерево решений предоставляет разбиения и правила, объясняющие, чему оно научилось. Точно так же в сверточной нейронной сети люди смотрят на изученные ребра и фильтруют, чтобы понять, чему научилась модель.
- Глобальная интерпретируемость: основное внимание уделяется пониманию того, насколько хорошо каждая функция может объяснить глобальный результат. Большинство моделей, поддерживающих глобальную интерпретируемость, используют функцию относительной важности, которая позволяет анализировать чувствительность и производительность модели.
- Локальная интерпретируемость: фокусируется на понимании взаимосвязи между каждой функцией и выходными данными в модели, оцениваемой на уровне экземпляра или группы. Внешние структуры, такие как LIME (локальное интерпретируемое объяснение, не зависящее от модели) или SHAP (аддитивные объяснения Шепли), представляют собой линейные прокси-модели, используемые для оценки локальной интерпретируемости путем возмущения входных данных.
В зависимости от характера прогноза и его цели интерпретируемость может иметь решающее значение. Может потребоваться итеративный подход, учитывающий компромисс между точностью и интерпретируемостью.
В заключение, AI / ML обеспечивает гибкость прогнозирования, а при использовании в сочетании со статистическими методами (гибридными или комбинированными) они помогают повысить точность прогнозов. Но будьте готовы к обеспечению точности, гибкости и интерпретируемости, чтобы переход к этим новым подходам был полезным.