ВЫЗОВ: РАБОТА МЕНЯЕТСЯ БЫСТРО. ПОСЛЕДУЕТ ЗАБОТА.

Хорошо оплачиваемая работа требует умений, навыков и знаний. База данных O * Net отображает профили для множества профессий. Заработную плату этих профессий можно найти в базе данных ACS / PUMS переписи населения США. Несмотря на все доступные данные, высококачественные исследования и огромные экономические ресурсы в сфере управления персоналом, по-прежнему только один из двадцати человек имеет работу, которая им подходит и которая их привлекает. Самая важная отрасль в мире - та, в которой работают миллиарды людей, - имеет всего пять процентов успеха (источник: Gallup). Это не только из-за нехватки ресурсов, но и из-за структурных недостатков. Я предполагаю, что ему не хватает языка для анализа, разработки стратегии и достижения целей.

Мы привыкли смотреть, что рабочие места требуют от людей. Но это работает не так хорошо, как раньше. Профессии меняются или исчезают с большой скоростью, и следует замешательство.

База данных O * NET

База данных O * NET остается полезной, в ней содержится информация о почти тысячах профессий, в которой ранжируется то, что каждая профессия требует от работников в отношении способностей, знаний, навыков и т. Д. Он охватывает порядка двухсот функций.

Он имеет иерархическое упорядочение: 23 основные группы занятий, 97 второстепенных, 461 широкая профессия и 840 подробных профессий.

Ниже приведена часть базы данных O * NET, показывающая необходимость 52 способностей в 461 профессии. Данные актуальны и хороши, но их сложно оценить с первого взгляда; сюжет - приятное произведение компьютерного искусства, не более того.

Предложение: архетипы, основанные на талантах, охватывающие большинство рабочих мест

В этом проекте я исследую, как науку о данных можно использовать для построения простого языка для работы и способностей, который команды и отдельные лица могут использовать в повседневной речи. Это связано с юнгианской психологией и «архетипами», как в личностном тесте «Майерс-Бриггс», который уже используется в HR.

Метод имеет следующие привлекательные особенности:

  • Архетипы легко обновлять. Если данные O * Net изменяются или добавляются другие источники данных, архетипы адаптируются.
  • Архетипы можно адаптировать, их можно адаптировать к подгруппам. Например, архетипы могут быть разными на Аляске и в Алабаме. Архетипы, созданные из статистики глухих, могут отличаться от средней статистики.
  • Архетипы имеют математическое значение. Их актуальность можно измерить, и, если они достаточно хороши, они будут полезны для выявления и обсуждения тенденций и корреляций. Разговорный язык и математическая аналитика синхронизированы.
  • Архетипы могут предложить больше понимания и лучшие рекомендации при подборе отдельных рабочих мест. Они могут сказать, есть ли несоответствие между архетипами талантов рабочих, показывающими, какие комбинации человеческих талантов часто совпадают, и архетипами работы, показывающими с комбинациями, которые обычно допускаются рынком труда.

Построение архетипов состоит из двух этапов.

1. СОЗДАНИЕ АРХЕТИПОВ

Архетипы создаются путем применения NMF (неотрицательная матричная факторизация), метода, который обычно можно использовать для сортировки данных по «темам» в базе данных O * Net. Количество Архетипов устанавливается по выбору.

Здесь данные в базе данных Onet, показанные здесь выше, были реконструированы в два архетипа, которые можно было бы обозначить «тело» и «разум» из-за способа группировки способностей. Способности каждого архетипа нормализованы, их интенсивность в сумме равна единице.

Отношение архетипов к способностям отражается их отношением к занятиям. На этом рисунке, вместо того, чтобы нормализовать архетипы, я нормализовал занятия так, чтобы он показал, сколько процентов «тела» и «ума» составляет занятие. В целом это четкое сечение с двумя регионами работы, которые значительно смешаны. Людям, которые любят тренировать как разум, так и тело, может быть интересно взглянуть на них поближе.

ПРИМЕР АНАЛИТИКИ АРХЕТИПА

Приведенные выше цифры включают дополнение к данным Onet: количество людей, практикующих каждую профессию. Это демографические данные из базы данных ACS / PUMS переписи населения США. Они предназначены для калифорнийцев в возрасте от 40 до 65 лет.

Количество архетипов полностью зависит от выбора. Здесь я выбрал четыре архетипа, которым дал подходящие прозвища. Алгоритм строит кластеры на основе того, насколько разные профессии требуют разных способностей (из O * net), взвешенных по тому, сколько калифорнийцев занимаются этими профессиями (из переписи). Занятия взаимосвязаны по способностям, а способности - по занятиям. Архетипы - это взаимосвязанные друг с другом группы способностей и занятий.

Статистические данные и аналитика архетипов могут быть автоматически созданы на основе комбинации данных O * Net и Census ACS / PUMS. Вот примеры статистики, сгенерированной для вышеупомянутых архетипов. Вот примеры занятий и их принадлежность к каждому архетипу:

«Умные» работы платят в среднем лучше, чем рабочие места, которые в основном связаны с тем, чтобы быть сильным или быстрым.

Архетип «удобный» не включен, потому что все задания «удобны» менее чем на 50%. В базе данных O * Net есть две широкие «удобные» профессии, которые достигают своей цели: кузнецы серебра и портные, но, очевидно, их слишком мало в статистике Калифорнии, чтобы их можно было увидеть на графике.

Это всего лишь один пример; возможности конструирования статистики безграничны, и они автоматически подстраиваются под выбор архетипов.

ИСПОЛЬЗОВАНИЕ АРХЕТИПОВ ДЛЯ ПРОГНОЗИРОВАНИЯ

Математический метод построения архетипов, NMF, похож на разложение по сингулярным значениям, которое является стандартным методом уменьшения размерности. Прогнозы можно улучшить, уменьшив количество измерений путем группировки коррелированных переменных. Фактически, это ключ к архетипам: более простой И более мощный язык для работы и способностей.

Средняя заработная плата зависит от гораздо большего числа переменных, чем просто от способностей работника: навыки и образование также важны, как и многие другие, и мы можем ожидать значительную долю случайности. Поэтому мы не можем ожидать слишком многого от способностей. Сколько? Это можно проверить, и я сделал это как с архетипами, так и со способностями. Как и ожидалось, архетипы гораздо более эффективны для предсказаний.

Вот сравнение. R²-оценка приближенно показывает, какая часть дисперсии может быть объяснена моделью. Оценка R2, равная 1,0, говорит о том, что модель дает идеальные прогнозы, поэтому я не могу ожидать, что приблизюсь к этому в данном случае.

Я сравниваю использование нескольких архетипов с равным количеством выбранных способностей. Архетипы работают намного лучше. Восемь архетипов - это оптимальный набор переменных для текущих данных, позволяющий предсказать примерно половину разницы в заработной плате. Набор из четырех архетипов, который я показал выше, не так хорош, но он все еще имеет предсказательную силу для заработной платы, близкой к одной трети, и его простота делает его эффективным инструментом для разговорного разговора о способностях и рынке труда.

Здесь показано качество подгонки для четырех и восьми архетипов соответственно.

Регрессия была сделана с помощью XGBoost, метода, который часто побеждает в соревнованиях Kaggle. Он ранжирует важность переменных для соответствия, как показано ниже. Важность следует рассматривать в перспективе набора из четырех архетипов, предсказывающего лишь треть колебаний в заработной плате.

ПРИМЕЧАНИЕ. «Важность характеристики» не означает «повышение заработной платы», это говорит о том, насколько важна функция для прогнозирования заработной платы. В данном случае у более «мускулистых» профессий в среднем самая низкая заработная плата, у «умных» - самая высокая.

ВЫВОДЫ И ДАЛЬНЕЙШИЕ ДЕЙСТВИЯ

Выводы

  • Соответствующие обновляемые архетипы для рынка труда могут быть созданы из баз данных O * net и Census.
  • Архетипы адаптированы к демографическим характеристикам путем построения их из подмножеств данных переписи населения США,
  • Аналитика удобна и автоматизирована.
  • Архетипы обладают большей предсказательной силой, чем исходные переменные в базе данных O * Net.

Следующие шаги:

  • Создайте веб-приложение, которое может адаптироваться к демографическим данным и предлагает набор аналитических данных.
  • Разверните данные до всех соответствующих переменных в O * Net и Census.
  • Добавьте источники данных, такие как объявления о вакансиях, где способности могут быть связаны с профессиями посредством обработки естественного языка.
  • Изучите возможности прогнозирования и определите подходящие методы настройки.
  • Тестируйте, используя архетипы в HR-командах, как инструмент для улучшения их коллективного интеллекта и формирования мощного общего языка.
  • Исследуйте подходящих людей и профессий, сопоставляя личные профили с архетипами.
  • Изучите рекомендации по обучению и образованию, которые позволяют использовать личные способности в соответствии с профессией и повышать заработную плату.