Анализ временных рядов данных SpotSpotter по семи полицейским округам за 2014–2017 гг.

Фон

В рамках проекта, осуществляемого в партнерстве с TheLab @ DC, частью Управления бюджета и эффективности Администрации города, я провел анализ временных рядов данных о выстрелах в Вашингтоне, округ Колумбия, за 2014–2017 годы. Две параллельные модели временных рядов использовались для определения хронологических тенденций и прогнозирования выстрелов на последующие 12 месяцев в семи полицейских участках [1].

Исследование, проведенное Институтом Брукингса, показало, что о преступлениях, связанных с оружием, выборочно не сообщается, и что использование данных ShotSpotter является альтернативным независимым инструментом измерения.

ShotSpotter - это интегрированная система акустического наблюдения, которая использует датчики для изоляции и триангуляции звука выстрела и оповещения властей о местоположении.

Распределение полицейских округов показано ниже.

Данные

Эти данные состоят только из отчетов о выстрелах и не содержат никакой информации об эффективности результатов выстрелов.

Данные охватывают 51 месяц с ежедневными наблюдениями за типом и местонахождением выстрелов, с окончательным набором данных с 1 0227 ежедневными наблюдениями [2]. Данные о широте и долготе в каждом отчете о выстреле накладывались на карту границ полиции, чтобы распределить инциденты по каждому из шести из семи полицейских округов, по которым имелись данные ShotSpotter. Данные ShotSpotter содержат большое количество ложных срабатываний в 2014–2015 годах, причем фейерверки часто ошибочно принимают за выстрелы в праздничные дни.

Исследование данных показало, что сходство движения как при множественном, так и при одиночном выстреле требует создания общей переменной для выстрела.

Методология

Авторегрессия и стационарность

Наборы данных временных рядов включают время как дополнительное измерение по сравнению с другими наборами данных. Допущения авторегрессии предполагают, что прошлые значения определенного временного ряда влияют на значения в будущих.

Ожидается, что в стационарных временных рядах волатильность по временным рядам вернется к долгосрочному стационарному равновесию после учета внешних шоков. В нестационарных рядах можно ожидать, что внешние шоки станут частью системы, чтобы ослабить сигнал, а также вызвать ложную корреляцию. Расширенный тест Дики-Фуллера был проведен для подтверждения стационарности данных временных рядов, которые показали незначительные p-значения при пороге 0,05.

Модели авторегрессии

В моделях авторегрессии используются несколько вариаций модели регрессии для преобразования входных данных с запаздыванием во времени в прогнозы на будущие периоды времени. Две модели были развернуты независимо друг от друга для проверки прогнозов и анализа друг друга.

Интегрированное скользящее среднее с автоматической регрессией (ARIMA) - это надежная модель множественной регрессии, которая показывает коэффициент автокорреляции, изменение значения и поведение члена ошибки по периодам времени. Модель также сводит нестационарный ряд к стационарному, используя последовательность разностей [3].

FB Prophet - это нелинейная аддитивная модель, разработанная Facebook для моделирования тенденций логистической кривой роста и создания интервалов неопределенности. Модель также моделирует годовую и еженедельную сезонную составляющую с использованием ряда Фурье и фиктивных переменных соответственно.

Интерпретация результатов

Функция автокорреляции (ACF) определяет конкретную сезонность тенденций. Здесь автокорреляция первого порядка преобладает среди данных, указывающих, что наличие выстрелов может привести к другим инцидентам с огнестрельным оружием в течение одного-двух дней после первоначального инцидента.

Выстрелы довольно равномерно распределены по году с некоторым увеличением, заметным в периоды апреля и ноября.

Обе модели прогнозирования выстрелов предполагали сокращение общего количества выстрелов в большинстве районов за пределами города, за исключением полицейских участков 6 и 7.

Об увеличении количества выстрелов сообщалось в июле и в период с декабря по январь, что снова свидетельствует о том, что проблемы, связанные с ошибочной классификацией фейерверков как огнестрельных, продолжаются.

Семидневный сезонный анализ показывает рост количества перестрелок, начиная с выходных, что снова отражает национальные тенденции.

Хорошие новости: количество огнестрельных ранений сокращается по большей части города.

По всей территории Вашингтона, округ Колумбия, количество огнестрельных ранений имеет тенденцию к снижению и, как ожидается, снизится в 2019 году. Это согласуется с исследованием ShotSpotter, которое поместило город в первую десятку городов с наибольшим падением количества перестрелок в 2017 году [4] .

Плохие новости: в полицейских участках 6 и 7 не ожидается снижения количества выстрелов.

Шестой округ и Седьмой округ охватывают части северо-восточного (к востоку от реки Анакостия) и юго-восточного квадрантов города и представляют собой сочетание категорий жилья, включая ряд крупных государственных жилищных комплексов. В этих двух областях есть очаги экономических трудностей и более высокая концентрация городских проблем.

Рекомендации и дальнейшие действия

Результаты показывают, что количество случаев огнестрельного оружия может быть уменьшено за счет увеличения присутствия полиции в выходные дни и в районах применения огнестрельного оружия в последующие дни.

На полицейские округа 6 и 7 могут быть нацелены дополнительные полицейские ресурсы, чтобы снизить уровень насилия с применением огнестрельного оружия, особенно если ресурсы станут доступны в связи с ожидаемым сокращением преступности с применением огнестрельного оружия в других областях.

В 2018 г. наблюдался рост преступности, связанной с огнестрельным оружием, хотя модель предсказывает уменьшение количества огнестрельных ранений. Это может быть объяснено выборочной группировкой огнестрельных ранений и убийств, связанных с применением огнестрельного оружия, в полицейских участках 6 и 7 или внешними ударами. Стрельба также может быть менее неизбирательной и более эффективной, что приводит к увеличению насилия, связанного с применением огнестрельного оружия, при постоянном количестве выстрелов.

Существует возможность для анализа временных рядов насилия, связанного с применением огнестрельного оружия, и для проверки взаимосвязи между этими двумя явлениями. Кроме того, изучение особенностей недвижимости, связанных с преступлениями с применением огнестрельного оружия и стрельбой из огнестрельного оружия, может повысить ценность моделирования городского планирования.

Выражение признательности: это более целенаправленное изучение данных об огнестрельном оружии, полученных в результате исследования оценщиков по прогнозированию количества огнестрельных ранений с использованием данных 311 и стоимости недвижимости. Я хотел бы поблагодарить моих товарищей по команде, Брайана Коллинза, Прию Каккар и Кихун Сон за их вклад в сбор и анализ данных

Сноски

[1] Полицейский округ 2 не имеет данных ShotSpotter

[2] https://mpdc.dc.gov/publication/shotspotter-data-disclaimer-and- Commandar y

[3] https://medium.com/auquan/time-series-analysis-for-finance-arima-models-acb5e39999df

[4] http://www.shotspotter.com/2017NGI