В последние годы искусственный интеллект (ИИ) для ИТ-операций, названный Gartner в 2017 году AIOps, находится в центре внимания компаний, поскольку прогнозируется, что к 2023 году 30% крупных корпораций будут использовать исключительно инструменты AIOps для мониторинга приложений и инфраструктуры, по сравнению с 5%. в 2018 году.

AIOps помогает улучшить ИТ-операции, применяя ИИ и машинное обучение (ML) к большим данным, собранным с помощью различных инструментов и устройств для ИТ-операций. По данным MarketWatch, к 2025 году глобальный рынок AIOps достигнет 11,1 млрд долларов США. В 2016 году рынок оценивался примерно в 0,8 млрд долларов США, и ожидается, что он будет расти со здоровыми темпами роста более чем на 34% в течение прогнозируемого периода 2017–2025 годов.

Частично рост обусловлен цифровым преобразованием, которое включает в себя внедрение организациями облачных сред, устройств IoT, интеграцию SaaS, мобильных приложений, а также повышение комплексной гарантии и времени безотказной работы бизнес-приложений. Традиционные подходы к управлению инцидентами для управления сложностью в этой динамичной среде не работают, и AIOps необходимы для ускорения успешной цифровой трансформации в ИТ-операциях.

По мере того, как организации продвигаются к AIOps и создают свои группы продвинутой аналитики, укомплектованные людьми, имеющими опыт работы с платформами и методами машинного обучения, большинство этих организаций изо всех сил пытаются сделать свои проекты ИИ действительно эффективными, чтобы запустить проекты в производство и интегрировать их с существующими приложениями и процессами. В последние годы я сосредоточился на преобразовании ИТ-операций с помощью ИИ и, основываясь на этих знаниях, вижу пять шагов для успешного внедрения и масштабирования AIOps.

Пять шагов к успеху

Платформа для выполнения вариантов использования AIOps включает следующие пять шагов.

1. Определение проблемы и ее масштаб

ИТ-лидеры активно ищут возможности для применения ИИ в ИТ-операциях, и первый шаг — определить масштаб/приоритизацию варианта использования ИИ, и очень важно сделать это правильно.

Эта фаза начинается с формулировки проблемы и подробно обсуждает вариант использования и возможности его производства. На этом этапе важно, чтобы команда была согласована с ключевыми показателями эффективности бизнеса. Поскольку успех проекта измеряется не производительностью модели, а ее влиянием на бизнес, которое фиксируется с помощью бизнес-KPI. Затем команда Data Science связывает производительность модели с помощью этого KPI.

На этом этапе команда переводит бизнес-проблему в задачу науки о данных, определяет целевую переменную, критерии оценки, критерии успеха и любые ограничения, связанные с выполнением варианта использования. Обеспечение того, чтобы команда согласовала ключевые показатели эффективности в начале, обеспечивает правильную расстановку приоритетов варианта использования и помогает сопоставить это с производительностью модели.

2. Оценка данных

Без правильных данных ни один проект ИИ не может быть успешным, а данные лежат в основе сценариев использования AIOps. Понимание источников данных и конвейера сбора важно знать, что если необходимые данные собираются для выполнения варианта использования. AIOps нуждается в надежном конвейере сбора данных из различных источников, таких как агенты, устройства, сетевые компоненты и приложения, чтобы знать о состоянии ИТ-среды в режиме реального времени. Учитывая все эти сложности, роль распорядителя данных становится здесь очень важной, поскольку именно он обеспечивает интерпретацию данных в различных источниках данных (метаданные, происхождение), а также обеспечивает соблюдение стандартов управления данными.

3. Разработка модели

На этом этапе специалисты по данным тратят большую часть своего времени на изучение/подготовку данных для понимания шаблонов, разработки функций и обучения моделей. Этот этап помогает преобразовать необработанные данные в идеи посредством итеративного создания модели, визуализации результатов и определения действий, необходимых для улучшения организации. Целью этого этапа является демонстрация и количественная оценка ценности модели и выбор модели для развертывания. Модель, разработанная на этом этапе, является проверкой концепции и потребует дополнительной работы для развертывания в производственных средах, что произойдет на следующем этапе.

4. Пилотный проект — разверните и запустите

После того, как модель будет разработана и на основе критериев оценки у команды будет лучшая модель для развертывания, команде необходимо запустить модель в пилотной среде, чтобы оценить производительность в реальных условиях и решить, готова ли модель к развертыванию в реальных условиях. полное производство и окажет необходимое влияние. На этом этапе Data Scientist работает с владельцем бизнеса и ИТ-владельцем, чтобы создать пилотную среду для запуска модели, поскольку она будет работать в полной производственной среде. Пилотная среда должна быть похожа на полноценную рабочую среду и давать основу для мониторинга и развертывания модели. Команда также будет работать над внедрением цикла обратной связи для сбора отзывов пользователей и данных и соответствующей доработки процесса/модели. На этом этапе вносятся изменения, необходимые для получения прироста производительности и ценности, определенных моделью, а пилотная среда устанавливает новые бизнес-процессы, необходимые для использования, принятия и поддержки варианта использования.

Основываясь на производительности модели в Pilot, команда примет решение о начале производства или отказе от него. Если команда решит перейти к производству, проект перейдет к следующему этапу.

5. Производственное развертывание и управление

На этом этапе команда развернет производственную версию решения, которая соответствует ИТ-экосистеме организации и методам эксплуатации. По мере развертывания модели в производственной среде и независимо от того, насколько хорошо модель работает во время развертывания, производительность модели со временем будет снижаться по мере появления новых шаблонов из-за вмешательств из-за модели и других изменений в среде. По этим причинам команда установит цикл обратной связи, который отслеживает производительность модели, и на основе определенного порога будет происходить переобучение модели.

По мере того, как в AIOps развертывается все больше и больше вариантов использования, бизнес-пользователи обеспокоены объяснимостью модели, поскольку они хотели бы знать, как модель определяет различные действия и какие функции изменяются и как влияют на решение, поэтому важно, чтобы владелец бизнеса находился на пути от определения масштаба до развертывания и принимал объединенные решения по отслеживанию KPI, пороговым значениям и т. д.

AIOps может улучшить многие аспекты ИТ-операций, от повышения производительности до улучшения качества обслуживания клиентов за счет обеспечения безопасности бизнес-приложений и времени безотказной работы. Необходимые технологии и инфраструктура теперь легко доступны: AIOps во многих организациях теперь является ключевым требованием для цифровой трансформации. AIOps помогает преобразовывать необработанные данные в упреждающее принятие решений, что повышает ценность бизнеса, но требует от компаний думать не только о технологиях, а также требует новых возможностей, которые включают в себя вариант использования AIOps в команде, структуру для запуска вещей в производство и постоянное внимание к управлению. для повышения эффективности AIOps.

Первоначально опубликовано на https://www.linkedin.com.