«Интересно… Какое отношение имеет наука о данных к государственной политике?»

Это обычная реакция, когда я говорю людям, что я учусь в магистратуре по специальности Вычислительный анализ и государственная политика. Я все еще работаю над идеальным кратким ответом на этот вопрос. А пока вот несколько мыслей и наблюдений по этому поводу, которые я собрал во время моих приключений в этом мире.

Примечание: я буду иметь в виду «науку о данных» в самом широком смысле, охватывающий все аспекты практики извлечения значимых идей из больших объемов данных.

Данные приносят много пользы в политическом мире

Достаточно взглянуть на Data Science for Social Good (DSSG), летнюю стипендию, которую проводят великие люди из Центра науки о данных и государственной политики Чикагского университета. В сотрудничестве с правительствами и некоммерческими организациями проектные группы DSSG применяют методы науки о данных в таких областях политики, как образование, общественное здравоохранение и социальные услуги.

Несмотря на серьезные проблемы, такие как проблемы с качеством данных и существование разрозненных отделов, практики нашли способы интегрировать науку о данных в сферу политики. Городские власти расширили сферу своих аналитических команд, включив в них больше возможностей для анализа данных. Когда лидируют Нью-Йорк, Чикаго и Бостон, а другие города следуют их примеру, эти группы по обработке данных помогают городским агентствам сосредоточить свои усилия на более эффективном обслуживании клиентов. Молодые компании, такие как Civis Analytics и BlueLabs, предлагают консультационные услуги в области науки о данных клиентам в правительстве, адвокатуре и политике. Члены гражданского технологического сообщества (например, Chi Hack Night) используют все более доступные открытые правительственные данные, чтобы вносить свой вклад в проекты в свободное время. Список вариантов использования гражданских данных довольно обширен, но, вкратце, данные помогают нам решать насущные проблемы политики так, как это было невозможно раньше.

Но наука о данных - это не решение всего

На недавней конференции по науке о данных основной доклад, казалось, создал атмосферу в комнате - что наука о данных - лучшее, что когда-либо случалось с организацией, и что другие «устаревшие» аналитические методы только мешают. Насколько я верю в достоинства больших данных и машинного обучения, я отказываюсь верить, что наука о данных - это серебряная пуля для решения всех мировых проблем, особенно в политической сфере.

Политические проблемы, которые пытается решить наука о данных, являются междисциплинарными и сложными. Люди работали над этими проблемами в течение нескольких поколений, и мы должны стремиться узнать об исторических, правовых и социально-экономических основах рассматриваемой области политики, прежде чем представлять решение для науки о данных. Нюансы реальности трудно передать словами, не говоря уже о моделях, поэтому лучшее, что мы можем сделать, - это попытаться понять предмет как с качественной, так и с количественной точки зрения.

Не забудьте подумать об общей картине, прежде чем прорабатывать детали в коде. На «Так какие» вопросы зачастую труднее всего ответить: как наука о данных может помочь в этой ситуации? Какие внутренние допущения и предубеждения будут учтены в модели? Кто будет им пользоваться и что они будут с этим делать? На чью жизнь повлияет результат? Только тогда мы сможем решить, является ли наука о данных правильным инструментом и как его лучше всего использовать.

Модель - это только первый шаг

Каким бы соблазнительным это ни было, мы не можем погрузиться в цифры, а затем передать результат лицам, принимающим решения в организации. Точное и эффективное сообщение модели так же важно, как создание сильного аналитического продукта. Интерпретируемость моделей - сложная тема, которая продолжает усложняться по мере того, как возможности науки о данных становятся все более продвинутыми. Тем не менее, нетехническим сотрудникам необходимо базовое понимание методов и выводов наших моделей, если мы хотим оказать какое-либо значимое влияние на государственную политику. Мы не можем ожидать, что люди будут слепо покупать то, чему они не доверяют или не понимают.

Мы также должны уметь говорить на одном языке со статистиками, экономистами и другими социологами, которые являются и будут оставаться важной частью политических организаций. Нам следует изучить, как наука о данных согласуется с практикой причинно-следственного вывода, оценкой программ и более традиционными методами анализа политики. Это поможет науке о данных завоевать большее доверие в сфере государственной политики.

Наука о данных - это привилегия

Поговорим о репрезентативности в области науки о данных. Наука о данных помогает нам беспрецедентным образом масштабировать человеческие ментальные модели и принимать решения. Эти алгоритмические модели при внедрении в государственную политику потенциально могут повлиять на средства к существованию миллионов избирателей. Поэтому крайне важно, чтобы люди, разрабатывающие их, могли представлять и сочувствовать затронутым людям.

Более широкое представительство женщин и меньшинств в области науки о данных поможет выявить и преодолеть непреднамеренные предубеждения в алгоритмах. По мере того, как мы движемся в мир, где царят технологии и процветают инновации, нам нужно больше представительства, чтобы гарантировать, что цифровая эпоха не оставит позади целые группы людей.

Я слышал, что наука о данных - это растущая область, и я благодарен за возможность изучать ее как часть моего стремления влиять на государственную политику и социальные изменения. И, как говорится, с большой привилегией приходит большая ответственность. Так что давайте продолжим учиться, делиться, задавать вопросы и кодировать, не забывая о людях, стоящих за числами на наших экранах.