Я создал API, который позволяет вам запрашивать набор данных о книгах, которые были запрещены в тюрьмах штатов по всей территории США. Вы можете проверить это на GitHub.

Это было сделано в ответ на накопившиеся в прошлом году разногласия по поводу запрета книг в школах и библиотеках. Мы часто не знаем о повседневной жизни заключенных, поэтому, когда стали доступны данные о цензуре в тюрьмах, я решил создать API, чтобы облегчить себе и другим доступ к информации программным путем. Осведомленность о цензуре, действующей в тюрьмах, помогает нам лучше понять формы контроля, с которыми сталкиваются заключенные, что мы можем использовать в более широких движениях за отмену тюрем.

В этом посте описаны концептуальные и дизайнерские решения, которые я принял при сборе данных для этого проекта. Вторая часть будет посвящена коду и будет размещена здесь, как только он станет доступен.

Первый набор данных

Когда я впервые задумал этот проект, запрещение книг было обычным заголовком в новостях. Многие сообщения касались полных запретов на книги, посвященные расе, полу, сексуальности и всему, что можно было бы считать социально девиантным. Нападки на критическую расовую теорию еще больше усилили цензуру по всей стране.

По мере того как сообщалось о все большем количестве случаев, мне стало любопытно, как они регистрируются и легко ли доступны данные о запрещенных книгах. Я нашел Индекс запретов школьных книг PEN America и первым начал этот проект с их набором данных. Хотя данные были чистыми и хорошо документированными, в них отсутствовала интересующая меня информация: ISBN, жанр и причина запрета. Я думал об автоматизации этой задачи с помощью программного поиска по названию и автору, но у меня возникли проблемы с результатами. Некоторые ISBN предназначались для разных изданий или форматов, а многие жанры были неполными или неточными. По возможности я добавлял эту информацию вручную. К сожалению, в PEN America не было поля причина, и было нецелесообразно проводить масштабное исследование, необходимое для включения этой информации, поэтому я отказался от него. Тем не менее, я думаю, что заполнение всех этих недостающих данных имеет смысл как коллективное усилие, включающее сообщество, представленное в повествовании, и/или более широкую читательскую аудиторию.

Первоначальные проекты

Отчет, который сопровождал набор данных PEN America, к сожалению, не включал таблицу с возможностью поиска, поэтому первоначальная цель этого проекта была сосредоточена на создании пользовательского интерфейса с возможностью поиска в дополнение к API. Я сделал несколько итераций в строке поиска:

Я просмотрел другие сайты книжных магазинов (Bookshop.org, Barnes & Noble и т. д.), чтобы получить представление о некоторых шаблонах проектирования. В конце концов я остановился на последнем, потому что он меньше походил на интернет-магазин: хотя функциональность была схожей, я не планировал, что проект будет носить коммерческий характер.

Самая простая версия страницы представляла собой панель поиска вверху со столбцом результатов внизу:

Дальше я работал над навигацией. Я попытался продумать некоторые возможные дизайнерские мотивы, начиная с затемненного текста, характерного для цензурированных документов. В конце концов я добавил смайлики «книга» и «запрещено», и мне показалось, что этого достаточно, чтобы посетители поняли, о чем проект. Мне понравился затемненный текст в качестве мотива, но я обнаружил, что он сильно жертвует разборчивостью, поэтому я выбрал более чистый интерфейс. Последние несколько дизайнов показывают, как я пытался включить панель поиска, в конечном итоге просто свернув ее в значок поиска, который раскрывался при нажатии.

Я также попытался расширить страницу поиска, снова позаимствовав книги с других книжных сайтов, где они выкладывали книги рядами с такими категориями, как «В тренде сейчас». Для этого проекта категории могли быть чем-то вроде «Самая запрещенная книга» или «Книги, запрещенные в Монтане»:

Мне нравилось думать о шаблонах проектирования для фильтров. В основном я хотел избежать большого количества раскрывающихся списков для таких полей, как даты, местоположения и т. д. Airbnb действительно хорошо сформулирован, позволяя пользователям мобильных устройств выбирать большое количество данных с минимальным количеством кликов, что привело к следующему:

Второй набор данных

Остановившись на вышеупомянутых проектах, я вернулся к добавлению информации в набор данных PEN America. Это был долгий процесс. Я закончил добавлять списки жанров и 10- и 13-значные ISBN почти к 500 книгам, когда произошел большой сдвиг: появился еще один набор данных. В декабре 2022 года The Marshall Project выпустил набор данных текстов, которые были запрещены в тюремных системах штатов, сопровождаемый инструментом поиска и письменным отчетом.

Я решил перейти от набора данных PEN America к этому. Мало того, что это было ближе к моему предполагаемому объему для этого проекта (завершение остальных записей заняло бы несколько недель), но и включало данные о том, почему книга была запрещена в первую очередь.

Окончательный дизайн

Поскольку проект Marshall также включал в себя инструмент поиска с их первоначальным выпуском данных, я мог сосредоточиться на разработке API, в то время как интерфейсу требовалась только доступная документация. Я сохранил элементы навигации и остановился на макете с одним столбцом, который содержал вводный текст вверху, информацию об использовании API в теле и нижний колонтитул с контактной информацией и разными ссылками. Я также сохранил большинство поисковых запросов. Я позволяю смайликам информировать меня о выборе цвета: зеленый для текста заголовка и красный для ссылок. В итоге остановился на чем-то близком к этому:

Заключение

Запреты на книги были главной темой прошлого года, но обширные данные по этой теме казались недоступными до тех пор, пока PEN America не опубликовал «Индекс школьных запретов на книги». В их отчетах подробно описаны общие тенденции относительно того, почему книги были запрещены и где. Кроме того, они помогли показать, как эти запреты происходят институционально; книга может быть запрещена либо в классе, либо в библиотеке, либо в обоих случаях, либо быть запрещена в ожидании расследования. Результаты часто отличаются от штата к штату.

В конце 2022 года The Marshall Project опубликовал еще один набор данных о запретах на книги, на этот раз о запретах в тюрьмах. Я переключился на этот набор данных, чтобы сохранить управляемость проекта и работать с данными, о которых мало что известно.

Хотя этот набор данных устранил некоторые проблемы, связанные с PEN America, он также ввел определенные ограничения. Опять же, в этом наборе данных не было поля ISBN или жанра, поэтому в нем отсутствовали уникальные идентификаторы, наиболее тесно связанные с книгами, и общая информация о содержании или формате книги. Многие записи также неполны или несовместимы друг с другом; например, поля «автор» пусты, или одна книга отформатирована как фамилия, имя и наоборот для другой. Кроме того, в некоторых книгах просто указано «Исключено» или ссылка на раздел другого документа в качестве причины запрета, без каких-либо дополнительных подробностей. В идеале эти поля должны быть заполнены и стандартизированы. Наиболее заметное упущение заключается в том, что в этом наборе данных отсутствуют целые штаты — согласно The Marshall Project, многие из них даже не отслеживают книги, которые они запретили.

Однако API опирается на эти ограничения в той мере, в какой они не приводят к ошибкам. Учитывая характер данных, эти пробелы дают нам представление о судебных процессах в каждом штате и о том, что они предпочитают опускать или объяснять.

Что касается дизайна, многие из моих решений были упрощены после того, как я сменил наборы данных. Мне больше не нужно было создавать внешний интерфейс с возможностью поиска (хотя я уверен, что это было бы хорошим упражнением), и мне нужно было сосредоточиться только на самом API вместе с разборчивой документацией.

Часть 2 будет посвящена коду API и будет связана здесь, как только станет доступна.