Написано с Саймоном Хадсоном

Любой, кто работает в отрасли или посещает известные конференции по искусственному интеллекту, может сказать вам, что существует гендерный дисбаланс, но мы чувствовали, что более тщательные исследования важны для продвижения разговора и ускорения исправления этого дисбаланса. В продолжение Глобального отчета о кадровом резерве ИИ на сайте jfgagne.ai, опубликованного в феврале, мы работали с WIRED, который также был заинтересован в более глубоком изучении состояния разнообразия кадрового резерва экспертов по ИИ. Что касается статьи, мы работали в сотрудничестве с Томом Симонитом из WIRED, чтобы глубже изучить исследование, добавив измерение пола и страны к данным исходного отчета.

В нашем исследовании мы сосредоточились на 4000 исследователей, которые были опубликованы на ведущих конференциях NIPS, ICML или ICLR (нашу методологию см. Во второй половине этого сообщения). На следующем графике представлены наши результаты:

Хотя аналогичные исследования проводились в мире технологий или стартапов, мы не видели, чтобы кто-нибудь измерял разнообразие в исследовательском сообществе машинного обучения в таком широком масштабе. Мы надеемся, что, зная, насколько искажены эти цифры, будет легче увидеть, насколько сложной задачей для отрасли является достижение баланса. По сути, мы надеемся, что эта повышенная ясность подтолкнет к более активным действиям в секторе искусственного интеллекта.

Мы не думаем, что было бы справедливо публиковать коэффициенты разных стран и не сообщать собственные цифры. В Element AI у нас 32% женщин, что соответствует 30% женщин на руководящих должностях. В наших технических и научных командах в среднем 21% женщин, из которых 20% занимают руководящие должности. Разнообразие, конечно же, выходит за рамки гендера, и мы продолжаем проводить внутренние исследования разнообразия и делиться ими во всей компании.

Гендерное соотношение в Element AI примерно вдвое выше среднего, и мы особенно гордимся тем, что у нас есть руководство, возглавляющее большие группы людей. Однако мы не хотим создавать иллюзию, что мы преодолели проблему создания разнообразного рабочего места. Мы считаем важным постоянно оценивать себя и поддерживать внутренние инициативы и мероприятия по разнообразию, которые способствуют реальному прогрессу.

Методология

Учитывая деликатность этого вопроса, мы сочли важным поделиться нашей методологией оценки гендерного баланса в глобальном кадровом резерве.

Чтобы обновить исходный набор данных, мы соскребли имена всех, кто присутствовал на NIPS, ICML или ICLR в прошлом году, и соединили их с информацией, полученной из Google Scholar. Затем мы пропустили список через Mechanical Turk, чтобы найти их филиал (в настоящее время ассоциированный университет или предприятие). Список был передан в Mechanical Turk трижды для обеспечения высокого уровня уверенности; все случаи, которые имели изменчивость, затем проверялись вручную на месте.

Имея эту информацию, можно было перегруппировать имена на основе географических кластеров. Важно отметить, что это не информирует нас о национальности каждого человека, а скорее дает нам вес для каждого учреждения и, следовательно, каждого географического местоположения. Причина в том, что мы изучали не отдельные данные, а институциональные тенденции.

Из 4000 имен только 17% принадлежат частным компаниям, что означает, что, хотя эта выборка является репрезентативной для всего исследовательского сообщества, мы не решимся сказать, что она репрезентативна для подраздела «Лаборатория бизнес-исследований». Кроме того, определенное количество шума существует в этой подгруппе людей, работающих в частных лабораториях; не всегда было возможно найти конкретное место исследования, над которым работал человек.

Более сложные случаи, около 12% названий бизнес-групп, все были из крупных технологических компаний (Google, Facebook и т. Д.) И были помещены в группу Кремниевой долины. Мы основали это решение на том факте, что добавление их в эту группу не изменило соотношение мужчин и женщин в регионе. У нас также есть рабочая гипотеза о том, что политика найма в этих компаниях остается неизменной от региона к региону, но мы оставили этот момент для подтверждения в более поздних исследованиях.

При определении пола мы использовали простые бинарные категории для простоты, поскольку большинство академических биографий не вдавались в подробности по этому вопросу. Определение пола было основано на использовании гендерных местоимений в описаниях авторов, чтобы отразить самоидентификацию автора. Когда этот метод был невозможен (около 1% от общего числа), было сделано обоснованное предположение, основанное на имени и внешнем виде. Несмотря на то, что отсутствие зависимости от пола, заявленного самим собой, более подвержено ошибкам, мы определили, что размер подгруппы был достаточно мал, чтобы оправдать методологию.

Особая благодарность Тому Симоните, Греггу Делману, Негару Ростамзаде и Вей-Вей Линю за график.

* Несколько тематических мероприятий, в которых мы участвовали: Семинар« Женщины в машинном обучении в НИПС» (2017); Семинар« Женщины в компьютерном зрении в CVPR (2017); Женщины в глубоком обучении (WiDL), соучредителем которого является наш Негар Ростамзаде в 2016 году; и наставники MISE Ghana Foundation в 2017 и 2018 годах.