Кэтрин Д’Игнацио и Лорен Кляйн поговорили с основателями PAIR Фернандой Виегас и Мартином Ваттенбергом о новой книге Кэтрин и Лорен Data Feminism (MIT Press, 2020). Кэтрин - доцент кафедры урбанистики и планирования Массачусетского технологического института, где руководит лабораторией Данные + феминизм. Лорен - доцент кафедры английского языка и количественной теории и методов в Университете Эмори, где она также руководит Цифровой гуманитарной лабораторией. Беседа была совместно отредактирована с помощью бывшего писателя PAIR Дэвида Вайнбергера.

Фернанда: Итак, для начала, как вы определяете феминизм данных?

Кэтрин: В книге мы определяем это как способ мышления о науке о данных, основанный на интерсекциональном феминизме. Это означает, что мы рассматриваем не только сексизм, но также расизм и колониализм, а также то, как они проникают в процесс обработки данных. Это краткий способ сказать это. Лорен, вы хотите что-нибудь добавить к этому?

Лорен: Это книга о силе науки о данных. Интерсекциональная феминистская линза дает анализ власти и неравенства. Иногда это скрывается в случайных разговорах об интерсекциональном феминизме.

Мартин: Когда дело доходит до визуализации данных, может быть, мы можем взглянуть на недавние примеры, потому что с тех пор, как разразился COVID19, у меня возникло ощущение, что мы наблюдаем расцвет визуализации. Есть ли такие, которые лучше или хуже соответствуют интерсекциональной феминистской модели?

Лорен: Обидно и неудивительно видеть, насколько своевременно мы говорим в книге о COVID. Ранняя реакция на пандемию стала синонимом «сглаживания кривой». Обмен сообщениями был связан с визуализацией кривой.

Но стандартных визуализаций было недостаточно. Например, визуализация случаев COVID в Financial Times стала первым ориентиром для многих людей.

Но Financial Times пришлось аннотировать кривые. Так как, например, все мы знали, что Южная Корея проверяет всех, а в Иране очень ограниченные испытания. FT признала, что изображение само по себе, даже несмотря на то, что оно представляло отчетные данные, не выполняло той работы, которую необходимо было выполнить. Образ нуждался в этих словах.

Кэтрин: В первых парах глав мы много говорим об отсутствующих данных, о том, что мы собираем, а не о том, что мы не собираем, и о том, как это соотносится со структурными силами притеснения, такими как расизм и сексизм. Например, в США мы не собираем данные о половой, расовой и этнической принадлежности смертей от COVID19. Об этих переменных действительно важно знать, и не только для женщин; это также важно для мужчин, потому что сейчас мужчины непропорционально часто умирают от COVID. Но у нас нет этих цифр на федеральном уровне, потому что у нас не было предусмотрительности, чтобы спланировать протоколы для сбора данных о пандемии.

Было интересно наблюдать за гражданскими деятелями, которые восполнили эти пробелы в данных. К ним, среди прочего, относятся Сеть журналистики решений, COVID Black и Данные для черных жизней. Data for Black Lives составляет национальную базу данных о том, какие штаты имеют какие данные, и лоббирует государства, чтобы добиться большего.

Фернанда: Я рада, что вы упомянули Data for Black Lives. Они говорят о данных как об инструменте социальных изменений. Это очень перекликается с вашей книгой. Как мы туда доберемся?

Екатерина: Нам предстоит гораздо более фундаментальное структурное изменение. Трудно создать инструменты борьбы с репрессиями, если базовая инфраструктура полностью репрессивна. Существуют серьезные изменения за пределами наборов данных и того, как мы используем данные, над которыми нам нужно работать в тандеме.

Таким образом, есть ограничения на то, что мы можем делать с данными, но в книге мы демонстрируем некоторые группы, которые работают такими антигипрессивными способами. Например, один из семи принципов в книге: Примите плюрализм. Как сделать так, чтобы у нас за столом больше людей - людей, на которых это оказывает непосредственное влияние, - участвующих в науке о данных гораздо более организованным и обоснованным образом? Необходимо многому научиться, чтобы эти группы могли говорить друг с другом на одном языке.

Но мы также говорим о прямых действиях и движениях, а также о важности построения действительно сильных общественных информационных экосистем и инфраструктур.

Лорен: Я также считаю, что мы должны отдать должное Data for Black Lives за то, что они принесли идею отмены смертной казни в область науки о данных. Это концепция, которая была в обращении со времен аболиционистского движения в 19 веке, и ее уже очень давно подхватывают движения за отмену тюрем и другие организации социальной справедливости. Когда в Data for Black Lives говорится, что они хотят отменить большие данные, это не значит, что они хотят покончить с ними. Скорее это означает замену репрессивной системы чем-то более раскрепощающим. В нашей книге мы также не говорим, что все данные плохие и поврежденные, и что мы должны вскинуть руки и уйти. Нет. Мы должны использовать наше воображение и заменить эти структуры чем-то порождающим. Это большая картина.

В частности, когда дело доходит до исследования на основе модели, вам необходимо правильно определить масштаб проблемы. Вы должны решить, на чем вы сосредоточены, что вы пытаетесь уловить в модели, которую строите, а затем понять, о чем она вам говорит. Это означает признание того, что все находится в более крупной системе или наборе систем, и что результат, который вы получаете от конкретной модели, дает вам только определенную информацию.

Это мое самое большое разочарование из-за того, как сейчас проводятся исследования. Сейчас захватывающее время для машинного обучения. Каждую неделю или месяц появляется какая-нибудь новая обученная модель, продвигающая современный уровень техники. Но мы фиксируем только очень и очень маленькую подмножество сложности мира.

Мартин: Ваша книга - часть длинной череды работ о данных и власти. Например, в классическом Как лгать со статистикой есть строчка, которая говорит, что хорошо обернутая статистика лучше, чем большая ложь Гитлера, потому что ее нельзя повесить на вас. И даже на обложке книги Эдварда Тафте Когнитивный стиль PowerPoint упоминается советский митинг сталинской эпохи. В вашей книге есть очень интересный аргумент о кажущейся объективности и о том, как строгий дизайн может укрепить структуры власти. В 20-м веке мы думали, что говорить правду власти можно с помощью ясности и простоты. Можно ли чему-нибудь научиться из этого подхода?

Екатерина: Здесь есть резонансы. В погоне за объективностью мы слишком многое исключили, включая эмоции, и тот факт, что все наши тела задействованы в познании и понимании. В книге это побуждает нас выступать за висцерализацию данных, концепцию, сформулированную Келли Добсон, которая означает создание данных, понятных для всего тела, а не только для глаз. Феминистский аргумент восходит к давней феминистской критике объективности, говоря, что мы должны спросить, для кого объективность, кому она служит, и кто остается в стороне, когда она не соответствует своим универсалистским и универсальным требованиям.

В книге мы говорим о красной карте Детройта, на которой районы Блэков показаны красным цветом, что означает высокий риск, что означает, что банки не предоставляют там ссуды. Это потрясающий пример масштабируемых больших данных - сверхсовременных технологий для своего времени.

На первый взгляд это выглядело настолько объективным, в то время как на самом деле оно отстаивало патриархальное и белое мировоззрение. Это имело действительно разрушительные последствия для городов. Как в этом примере, объективность часто может стать прикрытием интересов доминирующей группы. Вот почему мы говорим, что даже «нейтральная» визуализация является риторической в ​​том смысле, что она дает убедительный аргумент о мире. Нейтральные визуализации могут быть еще более убедительными из-за своей очевидной нейтральности.

Лорен: Еще до 20 века первые новаторы в области визуализации знали, что они использовали визуализацию риторически. Уильям Плейфэр, который изобрел круговую диаграмму и который, по мнению Туфте, является образцом объективности, сказал, что в мире царит хаос; он писал во времена американской, французской и гаитянской революций. Он сказал, что не знает, кто победит и на каком языке они будут говорить, но он хотел, чтобы любой мог оглянуться назад и получить четкое представление о том, что происходит в то время. И под ясным он не имел в виду холодную объективность. Это была преднамеренная риторическая стратегия, чтобы представить данные таким образом, чтобы они указывали на экономическую и политическую нестабильность того времени, даже если он не мог назвать это так в своей диаграмме ...

Фернанда: Какой для вас хороший пример?

Лорен: Одной из лучших недавних визуализаций стала New York Times’ визуализация внезапного увеличения числа безработных из-за пандемии. Согласно лучшим практикам, они должны были использовать логарифмическую шкалу, чтобы все поместилось в красивый прямоугольник. Но суть заключалась в том, чтобы показать, что рост был огромным. Они хотели, чтобы это активизировало ваши эмоции. Так они показали масштаб.

В книге мы утверждаем, что это хороший дизайн. Если при разработке визуализации вы сказали: «О, я просто импортирую числа в Excel, а затем он сам выберет масштаб», - это плохой процесс проектирования. Но если вы говорите, что ваша цель - показать людям, что эти цифры огромны и их необходимо признать, вам следует подумать о том, как вы можете выразить свою точку зрения, и не бояться, если это приведет к чему-то более эмоциональному, потому что это так или иначе считается. не быть объективным. Какая из этих визуализаций цифр занятости более ответственна, логарифмическая шкала или та, которая визуально показывает величину чисел?

Фернанда: Каких подводных камней можно избежать?

Кэтрин: Я думаю, что всегда очень важно помнить о том, что когда мы имеем дело с данными о людях, эти данные - это не просто данные. Например, на карте выселений точки представляют глубокую и напряженную личную жизнь. Нам необходимо собирать устные истории, а также использовать подход с использованием смешанных методов, потому что подход «точки на карте» не отражает воздействия на сообщество.

Мы также говорим в книге, что вы должны быть осторожны, чтобы не рассказывать «дефицитные рассказы», ​​особенно если ваша идентичность находится на пересечении нескольких доминирующих категорий - белых, мужских и образованных - и вы думаете, что делаете что-то хорошее, выглядя при неравенстве. Например, вы можете использовать данные, чтобы показать относительное отсутствие женщин в STEM. Но это может непреднамеренно превратить женщин в жертв, не имея свободы воли относительно того, что они могут с этим поделать. Или реакция белых людей на статистику материнской смертности чернокожих женщин может привести к тому, что белые люди будут думать, что они должны спасти чернокожих женщин. Это может сбить вас с толку. Вы думаете, что являетесь хорошим союзником, но на самом деле увековечиваете повествование о дефиците.

Лорен: Я увидела действительно хорошую инфографику о цифровом активизме от цифрового стратега Лесли Мак. У него были вопросы, которые вы можете задать себе перед тем, как присоединиться. Откуда и от кого исходит инициатива? Члены группы уже начали инициативу? Вы усиливаете это, или, может быть, вы даже не знаете об этом, потому что вы не сделали работу. Какая работа там уже проделана?

Фернанда: И если вы встретите такую ​​группу, обратитесь к ним.

Лорен: Определенно.

Фернанда: Что вы посоветуете дизайнерам, которые хотят работать лучше?

Лорен: Я бы посоветовал поискать вдохновение в самых разных местах. Некоторые из лучших работ сейчас исходят от независимых художников, организаторов творческих сообществ, активистов, ориентированных на дизайн, и просто простых людей со всего мира. Не все из этих людей имеют формальные полномочия в области дизайна, но это не обязательно означает, что их работа менее ценна. Один из моментов, который мы подчеркиваем в книге, заключается в том, что требование определенных полномочий или поиск определенной профессиональной принадлежности - это некоторые из способов, которыми женщины и цветные люди невольно исключаются из этой области. Но отличная работа - отличная работа, и все это считается визуализацией данных. Перед нами стоят огромные задачи, и нам понадобится как можно больше источников вдохновения и как можно больше сообщников, если мы собираемся внести значимые изменения в мир.

Кэтрин: Я бы посоветовал дизайнерам больше думать о создании ответственных визуализаций данных и меньше о попытках достичь «нейтральных», «правдивых» или «объективных» визуализаций. Ответственный - это относительный термин: вы подотчетны другому человеку или группе. Вы несете ответственность за уважение их человечности и достоинства, за то, чтобы освободить место для их эмоций, когда тема сложна, и за формирование интерпретации данных, которая приводит к более справедливым решениям и результатам. Кому подотчетна ваша визуализация?

Мнения в PAIR Q&A принадлежат респондентам, а не Google. В духе совместных исследований машинного обучения мы стремимся поделиться различными точками зрения на эту тему.

Чтобы узнать больше от Кэтрин, присоединяйтесь к нам на симпозиуме PAIR, который будет транслироваться в прямом эфире из Лондона, Бостона и Сиэтла 18 ноября.