Прогнозная аналитика человеческих ресурсов

ИИ, большие данные и машинное обучение

Испытание

Многонациональная компания с более чем 10 000 белых воротничков уже несколько лет имеет оборот вдвое выше, чем у конкурентов (>10% против ~5%).

Потребность компании была двоякой:

  • Понимание того, кто с большей вероятностью уйдет
  • Понять, почему эти люди уходили

Отделу кадров компании было поручено предоставить эти ответы руководству и определить возможные стратегии удержания, но их успех был незначительным. Кроме того, результаты каждой стратегии можно было оценить только в конце года, что делало процедуру «попробуй-ошибка-исправил-повтори» слишком затратной с точки зрения времени (и, следовательно, денег).

Мы предложили применить машинное обучение к уже имеющимся у компании данным, чтобы создать модель, которая могла бы одновременно давать высококачественные интерпретируемые прогнозы.

Решение

Учитывая сложность проблемы и зашумленность данных, мы поняли, что один оценщик, каким бы мощным он ни был, не смог бы предоставить нам самые современные результаты. Поэтому мы решили решить эту проблему, используя более сложный подход, который называется обучение ансамблем.

АНСЕМБЛЬНОЕ ОБУЧЕНИЕ включает в себя объединение нескольких оценок в «метаоценку» с большей прогностической способностью. Хорошо известными примерами метаоценок являются алгоритмы случайного леса или повышения градиента, а также искусственные нейронные сети. Однако само ансамблевое обучение — это определение, включающее ряд методов, среди которых мы выбрали наиболее мощный и еще неисследованный: обобщение с накоплением.

СОСТАВНОЕ ОБОБЩЕНИЕ отличается от всех других методов ансамблевого обучения, поскольку это единственный метод, который использует разнородные оценки. В то время как случайные леса и алгоритмы повышения градиента используют деревья решений, а нейронные сети используют нейроны, алгоритм многоуровневого обобщения может комбинировать десятки различных алгоритмов, которые, в свою очередь, также могут быть метаоценками.

Это приводит к огромному уровню сложности. На самом деле, построение успешной многоуровневой модели ансамбля требует от нас тщательного выбора одного из следующего:

  • единичные оценщики;
  • гиперпараметры каждой оценки; или
  • архитектура, используемая для их объединения.

Это соответствует поиску наилучшей комбинации неизвестного числа факторов, выбранных из потенциально бесконечного количества вариантов.

Так как же решить такую ​​чрезвычайно сложную проблему?
Решение называется AutoML.

AUTOML означает автоматическое машинное обучение и соответствует обучению искусственного интеллекта автоматическому выбору, настройке и размещению моделей машинного обучения так, как это сделал бы человек. Фактически, ИИ AutoML выбирает модель и применяет ее. модель к данным, а затем оценивает качество ее выходных данных. По мере того как тестируется все больше и больше моделей, AutoML AI начинает понимать, что работает с данными, а что нет. Это осознание делает его способным делать все более точные выводы, которые приводят к созданию все более и более лучших моделей. Кроме того, это можно запустить в распределенной среде, такой как облачная архитектура, для выполнения асинхронного выбора модели.

Полученные результаты

Объединив Stacked Generalization с AutoML с помощью облачного решения, использующего возможности распределенных вычислений, мы смогли создать стековую ансамблевую модель, которая дала как интерпретируемые, так и удивительно хорошие результаты. На самом деле, несмотря на отсутствие какой-либо экзогенной информации, наша модель смогла правильно идентифицировать 90% людей, покинувших компанию, с точностью до 50%; а именно, из двух кандидатов, выбранных нашей моделью для ухода из компании, один фактически покинул компанию в течение года.

Несмотря на то, что пандемия COVID-19 негативно повлияла на качество прогнозов нашей модели (выявление снизилось до 66%, а точность до 33%), заместитель начальника отдела кадров компании поздравил нас с достижением лучших результатов, чем все его подразделение.

Для получения дополнительной информации о нашем решении свяжитесь с нами по адресу [email protected].

Узнайте больше об Ennova Research