Прогнозирование: три основных аспекта, которые следует учитывать

Авторы ПКС Пракаш и Арун Шастри

Прогнозирование является критически важной потребностью для многих функций в каждой отрасли, и его основная цель - минимизировать неопределенности, связанные с процессом планирования. Например, прогнозирование ожидаемых продаж или доли рынка используется для планирования и контроля производственного процесса. Традиционные подходы к прогнозированию включают основанные на тенденциях или статистические методы, однако ландшафт прогнозирования значительно меняется сейчас, когда алгоритмы ИИ начинают использоваться в сочетании для определения прогнозов. При использовании в сочетании со статистическими методами они помогают повысить точность. Как? Лучшие статистические подходы извлекают тенденции и сезонность и используют ИИ для получения любой информации из оставшихся компонентов, не объясняемой статистическим подходом.

Если вы все же решите включить ИИ в свои модели прогнозирования, следует учитывать три ключевых аспекта:

Точность. Какова эффективность вашей модели искусственного интеллекта и каков правильный показатель для оценки прогноза?
Гибкость. Насколько гибка ваша система искусственного интеллекта при адаптации к изменениям в окружающей среде?
Интерпретируемость. Почему ваша модель искусственного интеллекта меняет прогноз? Что побуждает к предлагаемым изменениям прогноза?

Точность

На производительность ИИ влияет то, как оценивается ИИ и какая точность достигается при задержке (или «тестировании») данных. Есть несколько способов оценить точность решения AI в парадигме прогнозирования. Вот три полезных показателя ошибок, которые помогут оценить точность модели:

Ошибки, зависящие от шкалы: показатели ошибок, зависящие от шкалы, такие как средняя абсолютная ошибка (MAE) и среднеквадратичная ошибка (MSE), являются общими оценками. Эти показатели полезны для понимания величины ошибки в серии. Однако, учитывая, что эти меры имеют тот же масштаб, что и данные, эти метрики не имеют ценности для доступа к точности нескольких рядов.
Ошибки в процентах: средняя абсолютная ошибка в процентах (MAPE) является таким примером и также широко используется при прогнозировании. MAPE действительно хорошо работает на более высоких уровнях, например, в прогнозах на национальном уровне; однако MAPE имеет тенденцию искажаться, когда фактические значения приближаются к нулю. (Другие варианты, такие как sMAPE или MASE, могут обрабатывать асимметрию или асимметрию.)
Относительные ошибки. Этот показатель разделяет ошибку прогнозирования на ошибку базового уровня, чтобы сделать ее масштабной. (Например, относительная ошибка (t) = e (t) / e * (t), где e * (t) - ошибка от базового уровня.) Однако в случаях, когда ожидается прерывистый спрос, например, в запускаемых продуктах, эти показатели не так надежны, поскольку ошибки базового плана близки к нулю.

Определение неопределенности или интервалов прогнозирования для точечных оценок - это другая половина головоломки, связанной с точностью. Чем точнее решение, тем меньше интервал предсказания, указывающий на более высокую достоверность предсказания. Это оценивается с помощью средней шкалы интервалов (MSIS).

Чтобы получить правильные прогнозы, нужно поэкспериментировать, чтобы получить правильный выбор модели. Во многих фармацевтических компаниях прогнозирование - это трудоемкое занятие, проводимое членскими организациями страны, часто подверженными индивидуальным предубеждениям. Автоматизация прогнозов может повысить точность и гибкость процесса. В ходе недавнего взаимодействия с фармацевтическими компаниями, переходящего с национального уровня на уровень дистрибьютора, заводские прогнозы повысили точность прогнозов примерно на 4%. Точно так же добавление внешних переменных для заводского прогноза показало среднее улучшение примерно на 6%.

Ловкость

Другая большая ценность, которую ИИ и машинное обучение (AI / ML) привносят в прогнозирование, - это способность распознавать и быстро реагировать на изменения в окружающей среде, процессе прогнозирования или данных. Система AI / ML может помочь контролировать состояние прогнозов в режиме реального времени, отслеживая события, которые потенциально могут повлиять на прогноз. Три ключевых момента для достижения гибкости включают в себя:

Данные. Для гибкости требуется централизованное озеро данных или аналогичная структура для своевременного обновления данных. Если используются причинно-следственные модели, это могут быть данные на основе тенденций и времени или внешние факторы, такие как праздники, количество рабочих дней или прогнозы погоды.
Технология. Любая гибкая установка AI / ML должна поддерживаться соответствующим технологическим стеком, который принимает данные, облегчает моделирование и оценку и, наконец, увеличивает потребление. Некоторые из последних технологий, используемых в различных отраслях, включают озера данных, облачные вычисления, кластеры или графические процессоры для вычислений, языки программирования, такие как python или R, для моделирования, контроль версий для интеграции и платформы визуализации для отчетов о результатах.
Алгоритм. Разработка, развертывание и управление - три ключевых элемента использования алгоритмов для достижения гибкости. Компонент разработки гарантирует, что проблема решена правильно и оценивается с использованием соответствующих показателей точности. Развертывание обеспечивает автоматизацию процесса прогнозирования и гарантирует, что процесс может выполняться автоматически в пределах определенного временного разрешения. Управление моделью обеспечивает правильную работу алгоритма с течением времени с помощью процессов контроля качества, таких как проверка данных, и ключевых показателей эффективности модели, таких как показатели точности.

Интерпретируемость

Интерпретируемость - это описание ИИ / машинного обучения понятным людям способом. Чтобы повысить точность моделей, модели машинного обучения переходят на нелинейные классификаторы, такие как архитектуры глубокого обучения и ансамблевые методы. Эти подходы напоминают черный ящик, что затрудняет интерпретацию. Чтобы система была интерпретируемой, она должна выдавать выходные данные, понятные пользователям. Следовательно, это связано с познанием, знаниями и предвзятостью пользователей. Эта зависимость от людей может сделать прозрачную систему AI / ML убедительной. Для улучшения интерпретируемости модели может быть несколько уровней:

Интерпретируемость модели: основное внимание уделяется тому, как алгоритм учился на основе заданных данных. Например, дерево решений предоставляет разбиения и правила, объясняющие, чему оно научилось. Точно так же в сверточной нейронной сети люди смотрят на изученные ребра и фильтруют, чтобы понять, чему научилась модель.
Глобальная интерпретируемость: основное внимание уделяется пониманию того, насколько хорошо каждая функция может объяснить глобальный результат. Большинство моделей, поддерживающих глобальную интерпретируемость, используют функцию относительной важности, которая позволяет анализировать чувствительность и производительность модели.
Локальная интерпретируемость: фокусируется на понимании взаимосвязи между каждой функцией и выходными данными в модели, оцениваемой на уровне экземпляра или группы. Внешние структуры, такие как LIME (локальное интерпретируемое объяснение, не зависящее от модели) или SHAP (аддитивные объяснения Шепли), представляют собой линейные прокси-модели, используемые для оценки локальной интерпретируемости путем возмущения входных данных.

В зависимости от характера прогноза и его цели интерпретируемость может иметь решающее значение. Может потребоваться итеративный подход, учитывающий компромисс между точностью и интерпретируемостью.

В заключение, AI / ML обеспечивает гибкость прогнозирования, а при использовании в сочетании со статистическими методами (гибридными или комбинированными) они помогают повысить точность прогнозов. Но будьте готовы к обеспечению точности, гибкости и интерпретируемости, чтобы переход к этим новым подходам был полезным.

Прогнозирование: три основных аспекта, которые следует учитывать

Точность

Ловкость

Интерпретируемость

Вопросы по теме