Молодец? Работайте с данными!

Снижение безработицы является ключевой темой в повестке дня большинства правительств. Во Фландрии (7,44% безработицы в июне 2015 г. [1]), например, правительство недавно приняло решение о повышении пенсионного возраста, что сделало поиск интересной работы для людей еще более важным. Важной стороной в этом контексте являются службы занятости. Они выполняют роль посредников на рынке труда, задачей которых является преодоление разрыва между соискателями и работодателями.

В этой короткой статье дается обзор одного из наших текущих исследовательских проектов в сотрудничестве с Фламандской службой занятости (VDAB), в котором мы изучаем, как можно адаптировать и применять методы интеллектуального анализа данных, чтобы помочь службам занятости выполнять свою роль посредника на рынке труда. Исследовательский проект, который мы здесь обсуждаем, исследует, какой выбор вакансий лучше всего рекомендуется тем, кто ищет работу.

Найти работу – непростая задача.

Найти работу – непростая задача. В прошлом году во фламандских службах занятости было размещено более 163 000 новых вакансий, и невозможно просмотреть все эти вакансии, чтобы найти те, которые соответствуют вашим интересам. Эта проблема, при которой слишком много информации для самостоятельной обработки, называется проблемой информационной перегрузки. В качестве решения проблемы информационной перегрузки исследования предложили системы, которые выбирают те элементы, которые могут быть наиболее актуальными для пользователя. Эти системы называются рекомендательными системами. Рекомендательные системы были успешно развернуты в таких контекстах, как интернет-магазины, где они могут увеличить продажи и повысить удовлетворенность клиентов. Также в контексте поиска работы были предложены рекомендательные системы.

В Руководстве по системам рекомендаций [2] область поиска работы классифицируется как область с высокой степенью риска, поэтому требуется хорошая проницаемость. Домен высокого риска — это домен, в котором пользователи обычно нетерпимы к плохим рекомендациям. Людей, жалующихся на плохие рекомендации службы занятости, найти несложно. Уровень проницаемости относится к тому, насколько хорошо объясняются причины выбора рекомендуемых элементов. Возможность очень четко объяснить пользователю, почему система выбрала эти конкретные элементы, повысит оценку системы, тем самым снизив риск. Из-за этого контекстуального требования рекомендательные системы на основе содержания широко используются большинством служб занятости, в том числе фламандскими службами занятости.

Системы рекомендаций по работе на основе контента работают, находя те вакансии, описание которых (функция, местоположение, требуемые компетенции и т. д.) лучше всего соответствует профилю пользователя (желаемой функции, местоположению, обладающим компетенциям и т. д.). Преимущество рекомендательных систем этого типа в том, что они дают стабильные рекомендации, а это означает, что они обычно рекомендуют только те вакансии, которые достаточно близки к желаниям, указанным пользователем в его/ее профиле. Из-за этого рекомендации, которые они дают, легко объяснимы, что делает систему подходящей для контекста рекомендаций с высоким риском, такого как рекомендация по работе. Однако этот тип систем имеет ряд существенных недостатков. Во-первых, пользователям очень утомительно заполнять и поддерживать обширные профили, а работодателям заполнять подробное структурированное описание каждой публикуемой вакансии. Только подумайте, сколько вопросов вам ежедневно задает такой сервис, как LinkedIn! Требование обширного пользовательского ввода часто приводит к плохо заполненным профилям пользователей и вакансиям, что приводит к плохим рекомендациям: мусор на входе, мусор на выходе! Еще одним недостатком этих систем является то, что они требуют от пользователя полного выражения своих интересов с точки зрения функций, предлагаемых системой. Это может быть утомительно, как упоминалось ранее, или не всегда возможно из-за сложной природы человеческих интересов. В первом эксперименте мы отслеживали поведение более 200 000 пользователей веб-сайта службы занятости в течение одного года и сравнивали, какие вакансии они просматривали сами (используя поисковую систему на основе ключевых слов) с типами вакансий, которые они явно указали как нужные. заинтересованы в их профилях. Результаты поразительны: средний пользователь имеет 2,8 желаемых типа работы в своем профиле, но просматривает вакансии, охватывающие 10,3 типа работы, не упомянутые в этом профиле. Эти цифры ясно показывают, что система, основанная исключительно на контенте, упускает из виду большую часть интересов соискателей.

В попытке лучше охватить весь спектр пользовательских интересов мы разработали и внедрили рекомендательную систему исключительно на основе неявной обратной связи пользователя.

В попытке лучше охватить весь спектр интересов пользователей мы разработали и внедрили рекомендательную систему, основанную исключительно на неявной обратной связи пользователя, а не на использовании профиля пользователя. Неявная обратная связь — это все сигналы, которые пользователь дает системе о своих предпочтениях, при этом пользователю не нужно осознавать, что он или она передает предпочтение. Примером явной обратной связи, используемой в нашей системе, является поведение при просмотре веб-сайта службы занятости: пользователь, повторно посещающий определенную вакансию несколько раз и просматривающий эту вакансию в течение более длительного времени, указывает на больший интерес к этой конкретной вакансии, чем если бы пользователь только посещает вакансию один раз или просматривает ее только в течение короткого промежутка времени. Поскольку мы больше не используем какие-либо структурированные данные, описывающие соискателей или вакансии, рекомендовать вакансии, которые могут понравиться пользователю, становится немного сложнее. Мы используем популярный метод рекомендаций, который называется совместная фильтрация. Совместная фильтрация основана на том принципе, что если два пользователя проявляли одинаковый интерес к элементам до настоящего момента, они, вероятно, также понравятся одним и тем же элементам в будущем. Первым шагом в нашей стратегии совместной фильтрации является поиск пользователей, которые дали отзывы, аналогичные отзывам соискателя, для которого мы создаем рекомендуемые вакансии. Как только мы нашли этих похожих людей, мы можем порекомендовать вакансии, на которые смотрели эти похожие люди, за исключением тех, которые соискатель уже видел (потому что соискатель уже знает о них).

Оценка этой совместной системы фильтрации и сравнение ее с системой на основе контента, используемой в настоящее время службами занятости, является постоянным исследованием. Наши первые эксперименты выявили интересные различия между ними. Автономная оценка показала, что рекомендательная система совместной фильтрации дает более разнообразные рекомендации и имеет отзыв в пять раз выше, чем рекомендательная система на основе контента. Отзыв определяется процентом вакансий в наборе рекомендуемых вакансий, которые пользователь просмотрел бы самостоятельно. Система с более высоким уровнем отзыва лучше имитирует поведение пользователя при поиске. Текущие эксперименты включают тестирование экспертами службы занятости с последующим тестированием пользователями в реальном времени с использованием A/B-тестирования. Будет чрезвычайно интересно посмотреть, подтвердят ли эти онлайн-оценки наши предварительные выводы.

Основные выводы этой короткой статьи можно резюмировать следующим образом:

  • Рекомендация работы людям — область рекомендаций с высоким риском. При принятии решения о том, какие методы и данные использовать, требуется тщательное рассмотрение;
  • Только сосредоточение внимания на явном профиле соискателя приведет к тому, что мы упустим большую часть его / ее профессиональных интересов;
  • На данный момент наши эксперименты показывают, что использование неявной обратной связи соискателей в сочетании с совместной фильтрацией приведет к более разнообразным рекомендациям, которые лучше имитируют естественное поведение соискателя при поиске работы.

Сноски

  1. Уровень безработицы во Фландрии.
    Получено с сайта arvastat.vdab.be.
  2. Кантор П.Б., Рокач Л., Риччи Ф. и Шапира Б.
    (2011). Руководство по системам рекомендаций. Спрингер.

Первоначально опубликовано на www.dataminingapps.com.