Здравствуйте, в этой статье мы рассмотрим модель регрессии, которую я применил на платформе Azure ML Studio. Цель состоит в том, чтобы разработать модель машинного обучения для прогнозирования рабочего времени на соответствующей должности на основе статуса увольнения сотрудников. Метод, использованный в статье, представляет собой алгоритм регрессии леса решений. Объясняются такие шаги, как подготовка данных, маркировка категориальных переменных, выбор важных функций, разделение набора данных на данные для обучения и тестирования и настройка гиперпараметров. Полученные результаты демонстрируют успешное создание модели, которую можно использовать для прогнозирования рабочего времени на соответствующей должности при наличии информации о статусе работы новых кандидатов.

Цель: цель состоит в том, чтобы разработать модель машинного обучения, которая прогнозирует рабочее время на соответствующей должности на основе получения информации о статусе работы кандидата.

Алгоритм:регрессия леса решений

Модель:

Подготовка данных. Набор данных, содержащий атрибуты сотрудников (переменные) и информацию об их рабочем времени, подготавливается для прогнозирования рабочего времени. Набор данных включает в себя текущий статус сотрудников, а для тех, кто ушел с работы, он содержит дату увольнения, а для текущих сотрудников содержит пустое значение. Даты увольнения действующих сотрудников заполняются путем добавления текущей даты исходя из дня выполнения работы.

Редактировать метаданные. На этом этапе категориальные переменные в наборе данных (например, пол, отдел, уровень образования) помечаются. Этот процесс позволяет преобразовывать категориальные переменные в числовые значения, понятные алгоритму машинного обучения.

Выбрать столбец в наборе данных. На этом этапе выполняется выбор функций (столбцов), которые будет использовать модель. Наиболее важные столбцы выбираются на основе процентного вклада в производительность модели, полученного с помощью анализа важности признаков перестановки.

Разделение данных.Набор данных разделен на две части со случайными пропорциями 80 % и 20 % для этапов обучения и тестирования модели соответственно. Часть 80% используется для обучения модели, а часть 20% отводится для оценки производительности модели.

Настройка гиперпараметра модели. Этот шаг используется для оптимизации алгоритма регрессии леса решений. Настройка гиперпараметров — это процесс, используемый для максимизации производительности алгоритма машинного обучения. Узел Tune Model Hyper Parameter пробует различные комбинации гиперпараметров для повышения производительности модели и выбирает те, которые дают наилучшие результаты. Таким образом, определяются наилучшие параметры конфигурации для модели.

Результаты:

В заключение, в этом исследовании была создана модель машинного обучения с использованием алгоритма регрессии леса решений на платформе Azure ML для прогнозирования рабочего времени на соответствующей должности на основе статуса увольнения сотрудников. Набор данных был обработан, категориальные переменные были помечены, важные функции были выбраны, набор данных был разделен на данные обучения и тестирования, а гиперпараметры модели были эффективно настроены. Эту модель можно использовать для прогнозирования рабочего времени на соответствующей должности при наличии информации о статусе работы нового кандидата.