Уроки, извлеченные из предыдущих крупномасштабных экспериментов

Города являются двигателями экономического роста, возможностей и культурного распространения. В одних только Соединенных Штатах проживает примерно 80 процентов населения. Однако города по-прежнему сталкиваются с рядом структурных препятствий на пути к устойчивости, включая разрушающуюся инфраструктуру, увеличивающуюся загруженность дорог, загрязнение, городскую бедность, бездомность и преступность. К счастью, в последние годы, по мере развития области науки о данных, исследователи и политики начали использовать большие общедоступные и частные наборы данных для решения некоторых из этих проблем качества жизни новыми способами. Фактически, ряд городов - в частности, Нью-Йорк, Чикаго и Сан-Франциско - вложили большие суммы денег в разработку надежной инфраструктуры обмена данными для повышения прозрачности агентств и сотрудничества с некоммерческим и гражданским технологическим секторами. . Города все больше видят ценность в понимании своих данных и потенциале, который он имеет для создания городов, которые не только умны, но и более равноправны, доступны и эффективны.

Хотя, безусловно, существует множество подходов к использованию открытых данных для создания политик, основанных на данных, одним из подходов или методов, которые получили широкое распространение в последние годы, является разработка инструментов машинного обучения для городской политики. Машинное обучение - это особенно привлекательный подход к генерированию полезной информации из-за его способности автоматически анализировать очень большие наборы данных и генерировать довольно точные прогнозы для конкретного события. Когда вы думаете о машинном обучении (или прогнозной аналитике, как это часто называют), это помогает подумать об Amazon и о том, как его модель может предсказать, что вам может быть интересно купить, прежде чем вы сами даже осознаете, что вы Скорее всего, вы захотите купить аксессуар для товара, который находится в вашей тележке, например. Amazon может создавать эти предложения на основе исторических данных о том, что другие клиенты покупали в прошлом, а также покупают интересующий вас продукт. Точно так же мы можем применить этот подход к ряду проблем качества жизни в городов, создавая прогностические модели, которые могут предупредить нас о потенциальном событии до того, как оно действительно произойдет. Двумя примерами моделей машинного обучения, используемых в городской политике, являются прогнозирование полицейской деятельности в Чикаго и прогнозирование бездомности в округе Лос-Анджелес. Я пишу об обеих этих моделях, чтобы сравнить способы интерпретации факторов риска для каждого результата и описать различия между намерением и воздействием в каждом случае.

Предиктивная полицейская деятельность в Чикаго

Практика прогнозирующей работы полиции включает в себя крупномасштабный анализ исторических данных об арестах и ​​количествах преступлений для последующего прогнозирования вероятности совершения преступления в определенной области или среди определенной группы людей. Лос-Анджелес и Нью-Йорк были одними из первых городов, которые опробовали локальную полицейскую систему с прогнозированием, чтобы более эффективно снизить преступность и сократить расходы. Этот метод анализирует ряд наборов данных о преступности, чтобы предсказать, где и когда вероятно совершение преступления. Позже в Чикаго была внедрена альтернативная форма прогнозирующей полицейской деятельности - индивидуальная прогнозирующая полицейская служба - которая использует исторические данные для прогнозирования того, кто может подвергаться наибольшему риску стать жертвой или исполнителем огнестрельное насилие. Модель, разработанная исследователями из Технологического института Иллинойса и вдохновленная исследованиями Йельского университета, использовала эпидемиологический подход для создания этих прогнозов.

В то время как чикагская инициатива, также называемая Список стратегических субъектов, возможно, имела хорошие намерения, критики утверждали, что модель слишком сильно полагалась на данные об арестах, в результате чего ряд лиц, арестованных за ненасильственные преступления, были фактически наказывались усилением слежки и преследований со стороны властей. Таким образом, многие люди, которые действительно были ранены в результате огнестрельного оружия, не были отмечены как лица высокого риска, поскольку они не были арестованы. Более того, недавнее расследование, проведенное офисом генерального инспектора Джозефа Фергюсона, показало, что офицеры и командиры не были достаточно обучены тому, как интерпретировать результаты, которые не обновлялись с августа 2016 года по январь 2019 года. Члены сообщества и активисты движения за гражданские права утверждали, что все эти факторы способствовали ненужному профилированию цветных сообществ.

Эти опасения были подтверждены выпуском отчета RAND за 2019 год, в котором оценивались стратегии полицейской службы Чикаго. В отчете было обнаружено, что список лиц, которые считались наиболее опасными, был в лучшем случае даже не таким эффективным, как список наиболее разыскиваемых. В худшем случае она без надобности привлекает внимание полиции к людям, создавая новую форму профилирования ». Вскоре после публикации отчета RAND полицейское управление Чикаго решило прекратить программу .

С тех пор полицейское управление Чикаго переключило свое внимание и ресурсы на поддержку недавно принятой инициативы Центры поддержки стратегических решений, которая, как указывается в отчете RAND, кажется более эффективной в снижении преступности.

Прогнозирование количества бездомных в округе Лос-Анджелес

Неудивительно, что бездомность в Лос-Анджелесе - одна из самых серьезных проблем для Анджеленоса, где, по оценкам, 60 000 жителей остаются без крова каждую ночь. Однако, как можно было предположить, работа с незащищенным бездомным населением может быть довольно дорогостоящим. Таким образом, исследователи из Лаборатории политики Калифорнии и Лаборатории бедности Калифорнийского университета в партнерстве с Инициативой для бездомных округа Лос-Анджелес и Управлением главного информационного директора (CIO) округа Лос-Анджелес разработали модель, которая могла бы более точно предсказать, кто может оказаться в больнице. самый высокий риск бездомности и разработать стратегию поддержки этих людей и их семей до того, как они потеряют свой дом. Согласно промежуточному отчету, опубликованному исследовательской группой, 3000 человек из группы высокого риска в 48 раз чаще стали бездомными, чем средний клиент округа. У первого процента людей - примерно 19 600 человек - вероятность оказаться бездомным в течение следующих 12 месяцев в 34 раза выше, и примерно у одной трети из них это действительно так. Среди этих людей некоторые общие темы или предикторы бездомности, кажется, связаны с агентствами и службами округа, от служб психического здоровья до тюремного заключения и испытательного срока. Исследовательская группа утверждает, что при более целенаправленном подходе примерно 6900 из этих жителей смогли бы избежать бездомности.

Учитывая положительные результаты, официальные лица по делам бездомных округа Лос-Анджелес проголосовали за запуск пилотной программы стоимостью 3 000 000 долларов США для тестирования модели на активных получателях услуг округа и составления списка для городских агентств, нацеленных на профилактические услуги. Следующий этап этой работы предполагает использование более строгого подхода к выявлению наиболее сильных факторов, способствующих приближению бездомности, и использование этих характеристик для точной настройки стратегии округа по предотвращению бездомности.

Обсуждение

Поскольку города продолжают изучать различные способы использования больших данных и методов машинного обучения для информирования городской политики, из предыдущих примеров можно извлечь ряд уроков.

В Чикаго то, что начиналось как благонамеренный метод выявления жертв и виновных в насилии с применением огнестрельного оружия, привело к новой форме компьютеризированного профилирования без ведома офицеров и командиров. Отсутствие прозрачности в отношении того, как модель будет определять лиц с высоким уровнем риска, привело к широкой критике со стороны активистов за гражданские права и целых цветных сообществ. Кроме того, дополнительные временные и трудовые затраты на постоянное обновление модели и создание новых оценок для отдельных лиц привели к использованию модели, которая быстро устарела в быстро меняющемся городском ландшафте.

В Лос-Анджелесе, хотя предоставление услуг по предотвращению бездомности является гораздо менее спорной темой, все же верно, что временные и трудовые затраты на обновление модели предотвращения бездомности могут быть довольно высокими. На данный момент исследовательские группы из Калифорнийского университета в Лос-Анджелесе и Калифорнийского университета в Чикаго будут заниматься обновлением моделей и изучением функций, но, глядя в будущее, округу Лос-Анджелес может потребоваться создать внутреннюю команду экспертов для поддержки модели и обеспечения ее устойчивости.

Примеры, представленные в этом посте, подчеркивают прекрасную возможность, которую имеют города использовать машинное обучение для создания политики, основанной на данных, а также выделяют поучительную историю о прозрачности данных при прогнозировании и обслуживании моделей. Тем не менее, инструменты прогнозирования для городской политики все еще относительно новы, но они наверняка будут применяться к другим вопросам качества жизни, где прошлые модели и сценарии использования помогут сформировать передовой опыт.