Обзор

Машинное обучение постепенно интегрируется в качестве основного инструмента почти во все отрасли. Это дает множество преимуществ, таких как увеличение доходов и более эффективное принятие решений, но специалисты по обработке данных и организации должны осознавать этические нормы в отношении машинного обучения. Это связано с тем, что машинное обучение по своей сути несправедливо. Специалисты по обработке данных должны этично использовать эти инструменты таким образом, чтобы не наносить вреда группам людей. Одна из областей, где это очевидно, - это алгоритмы прогнозирования. Алгоритм машинного обучения «учится», создавая правила на основе исторических данных, и может использоваться для обнаружения связей, корреляций и прогнозирования будущих результатов. Таким образом, специалисты по обработке данных должны осознавать любые социальные предубеждения, присущие обучающим данным, используемым для обучения их алгоритмов. Эта проблема также связана с тем, что по меньшинствам доступно пропорционально меньше данных. Таким образом, алгоритмы о меньшинствах обычно менее точны, чем алгоритмы о населении в целом. Это означает, что у нас может быть алгоритм, который кажется точным в целом, но не для меньшинства.

Важно обсудить эти вопросы и привлечь внимание к чрезвычайно важной, но часто упускаемой из виду проблеме. Также стоит упомянуть «мягкие навыки» и знание предметной области, необходимые для того, чтобы быть эффективным и этичным специалистом по данным. Важно уделять приоритетное внимание справедливости и соответствующим образом использовать ресурсы. Что хорошего в машинном обучении, если оно работает только для белых американцев? К сожалению, расизм и сексизм по-прежнему являются актуальной проблемой в Соединенных Штатах, поэтому современные специалисты по данным должны понять социальный ландшафт и внести свой вклад в борьбу с дискриминацией.

Регулирующие органы и политика

Я полностью согласен с тем, что компьютерные алгоритмы могут быть дискриминационными и усиливать человеческие предрассудки. Я думаю, что ключом к решению этих проблем является создание интегрированной экосистемы данных в наших организациях. Необходима система сдержек и противовесов со свободой открытого обсуждения этих вопросов. Часто может потребоваться больше времени и средств для обеспечения того, чтобы конкретный алгоритм был настолько честным и справедливым, насколько это возможно. Таким образом, важно, чтобы руководители наших организаций ценили этические методы обработки данных превыше всего. Заинтересованным сторонам может быть легко отмахнуться от этих проблем, особенно если они не оказывают существенного влияния на доход, поэтому к этим вопросам следует отнестись чрезвычайно серьезно.

Мы осознали важность соблюдения этических норм в отношении данных в нашем частном секторе, но какова роль регулирующих органов и государственной политики в снижении этого риска? Я думаю, что администрация Обамы сделала большой шаг, отдав приоритет науке о данных в государственной политике. В идеале этот акцент на данных будет передаваться нашим региональным, региональным и местным органам власти и регулирующим органам. Они должны играть активную роль в снижении риска дискриминационных компьютерных алгоритмов в отношении американской общественности. Кажется, что недостаточная скорость передачи данных является одной из причин того, что эти проблемы часто упускаются из виду.

Не многие люди «понимают» науку о данных, машинное обучение и искусственный интеллект; а также тех, кто иногда не заботится или не имеет ресурсов для эффективной оценки своих потенциально дискриминационных алгоритмов. Вот почему подход «сверху-вниз» к плавности передачи данных и этичности практики обработки данных кажется логичным вариантом. И наши политические лидеры, и лидеры частного сектора должны иметь базовые знания в области науки о данных и связанных с ней этических проблем.