Причинно-байесовские сети используются для моделирования влияния атрибутов справедливости в наборе данных.

Недавно я начал новый информационный бюллетень, посвященный образованию в области искусственного интеллекта. TheSequence - это информационный бюллетень, ориентированный на искусственный интеллект (то есть без рекламы, без новостей и т. Д.), На чтение которого уходит 5 минут. Цель состоит в том, чтобы держать вас в курсе проектов, исследовательских работ и концепций машинного обучения. Пожалуйста, попробуйте, подписавшись ниже:



Один из аргументов, который регулярно используется в пользу систем машинного обучения, заключается в том, что они могут принимать решения, не будучи уязвимыми для человеческой субъективности. Однако этот аргумент верен лишь отчасти. Хотя системы машинного обучения не принимают решений на основе чувств или эмоций, они наследуют множество человеческих предубеждений через наборы данных обучения. Предвзятость актуальна, потому что ведет к несправедливости. За последние несколько лет был достигнут значительный прогресс в разработке методов, которые могут смягчить влияние предвзятости и повысить справедливость систем машинного обучения. Несколько месяцев назад DeepMind опубликовала исследовательскую работу, в которой предлагается использовать старую статистическую технику, известную как причинно-байесовские сети (CBN), для создания более справедливых систем машинного обучения.

Как мы можем определить справедливость в контексте систем машинного обучения? Люди часто определяют справедливость с точки зрения субъективных критериев. В контексте моделей машинного обучения справедливость может быть представлена ​​как отношения между чувствительным атрибутом (раса, пол…) и результатом модели. Несмотря на то, что это правильное с точки зрения направления, это определение является неполным, поскольку невозможно оценить справедливость без рассмотрения стратегий генерации данных для модели. Большинство определений справедливости выражают свойства выходных данных модели в отношении конфиденциальной информации без учета отношений между соответствующими переменными, лежащими в основе механизма генерации данных. Поскольку разные отношения потребуют, чтобы модель удовлетворяла разным свойствам, чтобы быть справедливой, это может привести к ошибочной классификации как справедливые / несправедливые модели, демонстрирующие нежелательные / законные предубеждения. С этой точки зрения выявление несправедливых путей в механизмах генерации данных так же важно, как и понимание самих моделей.

Другой важный момент, который необходимо понять при анализе справедливости в моделях машинного обучения, заключается в том, что его характеристики выходят за рамки технологических построений и обычно включают социологические концепции. В этом смысле визуализация наборов данных является важным компонентом для выявления потенциальных источников предвзятости и несправедливости. Из различных структур на рынке DeepMind полагался на метод, называемый причинными, байесовскими сетями (CBN), для представления и оценки несправедливости в наборе данных.

Причинно-байесовские сети как визуальное представление несправедливости

Причинно-байесовские сети (CBN) - это статистический метод, используемый для представления причинно-следственных связей с использованием графической структуры. Концептуально CBN - это граф, образованный узлами, представляющими случайные величины, соединенными связями, обозначающими причинное влияние. Новизна подхода DeepMind заключалась в использовании CBN для моделирования влияния атрибутов несправедливости в наборе данных. Определяя несправедливость как присутствие вредного влияния чувствительного атрибута на графике, CBN обеспечивает простое и интуитивно понятное визуальное представление для описания различных возможных сценариев несправедливости, лежащих в основе набора данных. Кроме того, CBN предоставляют нам мощный количественный инструмент для измерения несправедливости в наборе данных и помощи исследователям в разработке методов ее устранения.

Более формальное математическое определение CBN - это граф, состоящий из узлов, которые представляют отдельные переменные, связанные причинно-следственными отношениями. В структуре CBN путь от узла X к узлу Z определяется как последовательность связанных узлов, начиная с X и заканчивая Z. X является причиной (влияет на) Z, если существует существует причинный путь от X к Z, а именно путь, ссылки которого указывают от предыдущих узлов к следующим узлам в последовательности.

Давайте проиллюстрируем CBN в контексте хорошо известного статистического исследования. Одно из самых известных исследований предвзятости и несправедливости в статистике было опубликовано в 1975 году группой исследователей из Университета Беркли. Исследование основано на сценарии приема в колледж, при котором абитуриенты принимаются на основании квалификации Q, выбора факультета D и пола G; и в которых кандидаты-женщины чаще обращаются в определенные отделы (для простоты мы рассматриваем гендер как бинарный, но это не является необходимым ограничением, налагаемым структурой). Моделируя этот сценарий как CBN, мы получаем следующую структуру. В этом графе путь G → D → A причинен, а путь G → D → A ← Q не причинен.

CBN и несправедливость

Как CBN могут помочь определить причинно-следственные связи несправедливости в наборе данных? Наш пример поступления в колледж показал наглядный пример того, как несправедливые отношения могут быть смоделированы как пути в CBN. Однако, хотя CBN может четко измерить несправедливость в прямых путях, косвенные причинно-следственные связи сильно зависят от контекстуальных факторов. Например, рассмотрим три следующих варианта нашего колледжа, в которых мы можем оценить несправедливость. В этих примерах полные или частичные красные пути используются для обозначения несправедливых и частично несправедливых ссылок соответственно.

Первый пример иллюстрирует сценарий, в котором кандидаты-женщины добровольно обращаются в отделы с низкими показателями приема, и поэтому путь G → D считается справедливым.

Теперь рассмотрим вариант предыдущего примера, в котором кандидаты-женщины подают заявления в отделы с низкими показателями приема из-за системных исторических или культурных факторов, и поэтому путь G → D считается несправедливым (как следствие, путь D → A становится частично несправедливый).

Продолжите контекстную игру, что произойдет, если наш колледж снизит количество зачисленных на факультеты, которые добровольно выбирают чаще женщины? Что ж, путь G → D считается справедливым, но путь D → A частично несправедлив.

Во всех трех примерах CBN предоставили визуальную основу для описания возможных сценариев несправедливости. Однако интерпретация влияния несправедливых отношений часто зависит от контекстных факторов за пределами CBN.

До сих пор мы использовали CBN для выявления несправедливых отношений в наборе данных, но что, если бы мы могли их измерить? Оказывается, небольшую вариацию нашей техники можно использовать для количественной оценки несправедливости в наборе данных и изучения методов ее устранения. Основная идея количественной оценки несправедливости основана на представлении контрфактических сценариев, которые позволяют нам спросить, не было ли несправедливо обработано конкретное входное значение модели. В нашем сценарии контрфактическая модель позволила бы спросить, могла бы отвергнутая женщина-кандидат (G = 1, Q = q, D = d, A = 0) получить такое же решение в контрфактическом мире, в котором ее пол был мужским. прямой путь G → A. В этом простом примере, если предположить, что решение о допуске получено как детерминированная функция f от G, Q и D, т. Е. A = f (G, Q, D), это соответствует запросу, если f (G = 0, Q = q, D = d) = 0, а именно, если кандидат-мужчина с таким же выбором факультета и квалификацией также был бы отклонен.

Поскольку машинное обучение продолжает становиться все более неотъемлемой частью программных приложений, важность создания справедливых моделей будет становиться все более актуальной. В документе DeepMind показано, что CBN могут предложить визуальную основу для обнаружения несправедливости в модели машинного обучения, а также модель для количественной оценки ее влияния. Этот тип техники может помочь нам разработать модели машинного обучения, которые отражают лучшие человеческие ценности и смягчают некоторые из наших предубеждений.