Подробное описание жалоб на сотрудников полиции Нью-Йорка с 1985 года.

Полиция Нью-Йорка получила сокращение бюджета на миллиард долларов после протестов против #DefundThePolice.

Я проанализировал все гражданские жалобы на сотрудников полиции Нью-Йорка с сентября 1985 года по январь 2020 года, чтобы понять контекст этих протестов.

Изучение данных

В наборе данных содержится 33 358 заявлений, 12 056 из которых являются уникальными инцидентами (некоторые жалобы содержат несколько обвинений, поэтому они появляются несколько раз, например «остановка транспортного средства» и «поиск транспортного средства», и могут иметь несколько истцов) .

Datapoints включают имя офицера, удостоверение личности, звание, возраст, пол и этническую принадлежность; возраст, пол и этническая принадлежность заявителя; а также время, место, тип и исход жалобы.

Давайте загрузим данные CSV и создадим DataFrame с помощью Python Pandas.

import pandas as pd
df = pd.read_csv(open('allegations_202007271729.csv'))

А пока рассмотрим данные по отдельным жалобам.

uniqueComplaints = df.drop_duplicates(subset='complaint_id')

Жалобы с течением времени

Количество отсортированных year_received столбцов дает нам ежегодные жалобы.

uniqueComplaints['year_received'].value_counts().sort_index()

Жалобы взорвались в начале 2000-х. Отчет NYCLU показывает, как увеличилось количество допросов, остановок, обысков и обысков полицией за этот период времени.

Мы также можем визуализировать, в какие месяцы были получены жалобы.

uniqueComplaints['month_received'].value_counts().sort_index()

Жалобы уменьшаются в ноябре и декабре - возможно, это связано со снижением количества звонков по 9-1-1 и преступности в целом зимой.

Без кода мы можем найти эти идеи, загрузив CSV в Apteo и построив график complaint_id по оси Y и month_received по оси X.

Жалобы по типу

«Злоупотребление властью» - безусловно, самая распространенная жалоба.

uniqueComplaints['fado_type'].value_counts()

Диспозиции

Подавляющее большинство жалоб были признаны необоснованными или сотрудники были реабилитированы. Они составляют 9 956 из 12 056 уникальных жалоб, или около 83%. Из 1769 подтвержденных уникальных жалоб большинство результатов касалось дисциплины, обучения, инструкций и отсутствия рекомендаций.

Было предъявлено всего 939 обвинений, включая такие меры, как сокращение времени отпуска.

uniqueComplaints['board_disposition'].value_counts()

Самый непослушный в Нью-Йорке

Давайте посмотрим на 10 офицеров, на которые поступило больше всего жалоб.

df['unique_mos_id'].value_counts().nlargest(10)

Это дает пары удостоверений личности офицеров и количество их жалоб.

25861    75
18731    75
19489    73
18530    73
18589    72
25814    65
22775    63
25478    56
20982    56
32054    50

Два худших офицера Нью-Йорка получили 75 обвинений, а десять лучших офицеров получили более 50 обвинений. Давайте подробно рассмотрим 10 лучших.

df.loc[df['unique_mos_id'].isin(df['unique_mos_id'].value_counts().nlargest(10).index)].drop_duplicates(subset='unique_mos_id')

Офицеры, связанные с наибольшим количеством жалоб, - это Мэтью Райх и Уильям Тейлор. Остальные - Гэри Мессина, Джозеф Талларин, Кристоф Маккормак, Уильям Тейлор, Дэвид Чизрайт, Пол Макмахон, Майк Сивил и Майкл Расо.

Принцип Питера

Принцип Питера утверждает, что сотрудники достигают уровня своей некомпетентности. Посмотрим, правда ли это в полиции.

Сначала мы находим самую раннюю жалобу каждого офицера.

earliestComplaints_uniqueOfficers = df.sort_values('complaint_id').drop_duplicates('unique_mos_id', keep='first')

Теперь мы можем сравнить столбцы офицерского звания на момент первой жалобы с его текущим званием.

earliestComplaints_uniqueOfficers['promoted'] = earliestComplaints_uniqueOfficers.rank_now == earliestComplaints_uniqueOfficers.rank_incident
earliestComplaints_uniqueOfficers['promoted'].value_counts()

Из 3996 офицеров незначительное большинство (2035) продвигались по службе хотя бы один раз после получения жалобы.

Все вплоть до

При анализе набора данных мне выделились несколько примеров.

Кристоф Маккормак получил 72 жалобы. Его первая жалоба была в должности офицера полиции в 1990 году (самый низкий ранг), после чего он получил повышение до сержанта, детектива, лейтенанта, капитана, заместителя инспектора, инспектора, а теперь является начальником. В 2018 финансовом году он получил зарплату в размере 223 890 долларов США.

Гэри Мессина получил 73 жалобы. В 1997 году он получил жалобу в качестве сотрудника полиции. С годами он поднялся по служебной лестнице и теперь является заместителем инспектора.

Пол и этническая принадлежность

Мы можем проанализировать пол и этническую принадлежность офицеров, получивших жалобы.

uniqueOfficers.mos_gender.value_counts()
uniqueOfficers.mos_ethnicity.value_counts()

2056 белых и 1940 небелых, из них 1154 выходца из Латинской Америки, 597 чернокожих, 186 азиатов и 3 американских индейца. 3 609 мужчин и 387 женщин.

Аналогичный кодекс дает нам пол и этнический состав заявителей.

uniqueComplaints.complainant_ethnicity.value_counts()
uniqueComplaints.complainant_gender.value_counts()

Большинство истцов - чернокожие. 8 157 мужчин, 2 073 женщины и 21 другой человек. 5979 - чернокожие, 2216 - латиноамериканцы, 1077 - белые, 671 - неизвестный / другой / отказался и 19 - американские индейцы.

Визуализация карты

Визуализировать жалобы по участкам было немного сложнее.

Я превратил Шейп-файл участков Нью-Йорка в Geopandas GeoDataFrame, объединил эти участки с фреймом данных участка value_counts и построил его.

Темно-красный выброс - с 2172 уникальными жалобами - является 75-м участком, печально известным высоким уровнем преступности и коррупции.

Документальный фильм Семь пять раскрывает эту коррупцию. Офицерам сказали прикрой свою задницу вместо не совершай преступлений. Тренинг честности был шуткой. Основное внимание уделялось укреплению духа товарищества среди офицеров, а не созданию сообщества. Копы, совершившие сотни преступлений, определили хорошего полицейского как человека, который никогда не откажется от другого копа.

Естественно, 75-й участок также является самым судебным участком.

Неудивительно, что районы с низким числом жалоб обычно находятся в более богатых районах. Например, 17-й участок имеет всего 76 жалоб и обслуживает восточную часть Мидтауна, включая такие районы, как Саттон-Плейс, со средним семейным доходом около 250 000 долларов. Между тем, в 75-й округ входит Восточный Нью-Йорк, где в 2018 году в бедности проживало 30% людей.

Прогнозирование результатов утилизации

Каждая жалоба имеет соответствующий результат рассмотрения: обоснованный, необоснованный или оправданный.

С тысячами жалоб модель для прогнозирования результатов рассмотрения может помечать дела, которые, вероятно, будут подтверждены комиссией по рассмотрению, что позволяет определять приоритеты на основе данных. Более того, пакетные прогнозы могут использоваться для обеспечения эффективного распределения ресурсов для комиссии по обзору.

Заявители также могут использовать это, чтобы предсказать исход своей ситуации.

Мы используем AutoML без кода Apteo для создания прогнозной модели с board_disposition в качестве ключевого показателя эффективности, который мы хотим прогнозировать. Классификация случайных лесов автоматически выбирается в качестве тестовой модели.

Такие характеристики, как тип заявления, имя должностного лица и участок, имеют большое значение. Мы можем подключить эти и другие переменные, чтобы предсказать результат нового распоряжения.

Заключение

Несмотря на то, что в последнее время работа полиции является актуальной проблемой, учитывая тысячи обвинений в злоупотреблении властью, неправомерном применении силы и многом другом, мы не можем делать вид, что в мире царит мир. Варианты уменьшения жестокости полиции включают реформирование системы полицейского арбитража, увеличение бюджета на обучение деэскалации и демилитаризацию полиции.