Искусственный интеллект можно использовать для решения сложных проблем в кенийском государственном секторе. Однако для тех, кто впервые использует ИИ, есть несколько факторов, которые могут повлиять на потенциальные преимущества и риски использования этих систем.

По мере развития искусственного интеллекта (ИИ) и машинного обучения все больше и больше государственных учреждений Кении начинают использовать эти технологии для улучшения процесса принятия решений. Недавние августовские выборы также подчеркнули важность скорости, сделав аналитику данных, известную своей способностью решать проблемы и делать прогнозы, ценным инструментом для навигации в эту историческую эпоху.

Цифровой генеральный план Кении на 2022–2032 годы, выпущенный в октябре 2022 года, предусматривает массовое использование и внедрение систем ИИ в ключевых государственных операциях.

Некоторые примеры того, как ИИ и машинное обучение будут использоваться в кенийском правительстве, включают выявление моделей уклонения от уплаты налогов, нацеливание на проверки мостов на основе данных об инфраструктуре, определение приоритетности дел для защиты и поддержки детей, а также прогнозирование распространения инфекционных заболеваний. Эти технологии могут помочь правительству работать более эффективно, улучшая результаты и снижая затраты.

Есть несколько ключевых соображений при внедрении решений ИИ в государственном секторе. К ним относятся обеспечение точности и отсутствия предвзятости алгоритмов, стабильности (это означает, что небольшие изменения вводимых данных не приводят к существенному изменению результатов), объяснимости и эффективного развертывания с учетом уникальных проблем и ограничений государственного сектора. Государственным учреждениям Кении важно тщательно учитывать эти факторы, чтобы успешно внедрять решения ИИ и пользоваться преимуществами, которые они предлагают.

Получение правильного баланса важно не только для минимизации рисков, но и для создания надлежащего экономического обоснования инвестиций и обеспечения того, чтобы деньги налогоплательщиков были потрачены правильно. Ниже мы рассмотрим каждый из этих пяти аспектов — адаптируемость, точность, отсутствие дискриминации, объяснимость, стабильность и принятие — применительно к кенийскому государственному сектору.

Адаптивность

При рассмотрении потенциального влияния ИИ на правительство Кении выделяют три основных этапа: разработка модели или алгоритма, извлечение информации из его результатов и реализация его результатов или рекомендаций. Одной высокоэффективной модели машинного обучения недостаточно — она должна быть включена в рабочие процессы и представлена ​​в интуитивно понятном и удобном для пользователя виде, чтобы поощрять внедрение.

Алгоритмы машинного обучения иногда могут давать точные, но противоречащие здравому смыслу выводы из-за большого объема используемых ими данных, которые людям может быть трудно понять и принять. Это может затруднить внедрение этих технологий, поскольку они могут потребовать от людей отказаться от традиционных методов и инструментов.

Чтобы стимулировать внедрение, важно вовлекать целевых пользователей в процесс разработки с самого начала и запрашивать частые отзывы. Также полезно разработать простой способ доставки и использования идей модели. Одна организация, которой удалось внедрить модели расширенной аналитики, сделала это, создав пользовательский интерфейс, объединивший несколько источников данных в единое простое в использовании решение. Это сделало работу менее утомительной, что повысило готовность заинтересованных сторон использовать как аналитику, так и инструмент.

Внедрение может стать проблемой для групп аналитиков как в правительстве Кении, так и в партнерстве с поставщиками. Для этого требуется опыт в различных областях, включая разработку вариантов использования, разработку моделей, разработку инструментов и управление изменениями. Эта «последняя миля» процесса часто бывает самой сложной, поскольку требует кросс-функциональных навыков и опыта.

Стабильность

Со временем производительность большинства алгоритмов может стать нестабильной, часто из-за того, что они разрабатывались с использованием данных, собранных до того, как алгоритмы использовались для принятия решений. Кроме того, серьезные изменения могут повлиять на актуальность данных, на которых обучались модели. Например, модели, обученные до августовских выборов 2022 года, могут оказаться неактуальными в будущем. Это проблема, с которой также могут столкнуться традиционные системы оценки рисков и человеческие решения.

Стабильность особенно важна в государственном секторе Кении, где на принятие решений влияет множество внешних факторов. Например, схемы мошенничества могут быстро развиваться, а изменения в требованиях к пособиям могут существенно повлиять на тип мошенничества, с которым сталкивается правительство, и на данные, на которых обучалась модель машинного обучения. Например, в некоторых округах на недавних августовских выборах 2022 года наблюдался значительный рост мошенничества с личными данными, связанного с политическими проступками, которые не были бы отражены в наборе данных, созданном до выборов. Такие изменения могут сделать исторические данные менее способными предсказывать будущее, лишив законной силы традиционные эвристики или правила принятия решений.

Чтобы определить, как часто следует обновлять модели, пользователям необходимо понимать скорость снижения производительности алгоритмов. Один из способов сделать это — протестировать его производительность, используя ретроспективные данные за разные периоды времени. Если модель хорошо работает на тестовых данных годичной давности, но не на данных двухлетней давности, повторное обучение модели между одним и двумя годами может помочь избежать деградации.

В идеале организации должны установить график регулярного тестирования и переобучения, чтобы постоянно обновлять и перестраивать свои эвристики. Однако модели также могут нуждаться в обновлении в связи с серьезными изменениями в базовом наборе данных, такими как внедрение новой политики или законодательства.

Точность

В государственном секторе Кении пользователи могут измерять эффективность алгоритмов с точки зрения улучшения процесса принятия решений. Хотя маловероятно, что алгоритм сможет точно предсказать все возможные результаты, пользователи могут начать с определения того, какие из них, скорее всего, приведут к лучшим решениям в конкретной ситуации. Рекомендуется сосредоточиться на двух-трех мерах, особенно важных для конкретного варианта использования.

Например, когда средства ограничены, государственные чиновники могут отдавать приоритет инвестициям в ремонт дорог, анализируя узкие места на дорогах. Они могут свести к минимуму количество ложных срабатываний (ремонт дорог без узких мест), чтобы сэкономить деньги налогоплательщиков, а не количество ложных срабатываний (отсутствие дорог с узкими местами). С другой стороны, налоговые органы могут захотеть оптимизировать выявление наиболее вероятных лиц, уклоняющихся от уплаты налогов, учитывая потенциальные последствия ложного обозначения кого-либо как лица с высоким риском уклонения от уплаты налогов. Точно так же, решая, каким учащимся присудить стипендию или деньги HELB, исходя из их вероятности получения высшего образования, школьная администрация может больше заботиться о ранжировании учащихся в правильном порядке, чем об абсолютной вероятностной оценке, которую отдельный учащийся получает по модели.

Важно установить четкую базовую точность для принятия решений перед внедрением алгоритма, независимо от того, основан ли он на исторических человеческих решениях или других методах. Знание того, когда алгоритм работает хорошо, а когда нет, по сравнению с базовым уровнем, может помочь обосновать его использование и способствовать постоянному совершенствованию.

Машинное обучение может значительно повысить точность по сравнению с традиционными процессами или системами принятия решений. Это может быть полезно для принятия более эффективных решений о распределении ресурсов, таких как сопоставление заключенных с наиболее подходящими программами реабилитации в исправительном учреждении. Это также может повысить эффективность, например, помогая социальным работникам расставить приоритеты в нужных случаях, и эффективность, например, определить, какие школьные программы наиболее эффективны для снижения показателей отсева.

Недискриминация

Существуют различные определения алгоритмической справедливости или справедливости в машинном обучении. Эти определения часто сосредоточены на обеспечении беспристрастного принятия решений или недопущении разрозненного воздействия на охраняемые законом классы. Смещение алгоритмов может проявляться по-разному, например, смещение наборов данных или искажение аналитических методов алгоритма или интерпретация данных человеком.

Чтобы решить проблему справедливости в машинном обучении, необходимо установить, что означает справедливость в контексте конкретного варианта использования, включая защищенные классы и показатели справедливости. Существует несколько способов измерения и решения проблемы справедливости, но не все они могут быть одинаково эффективны в каждой ситуации.

Один из подходов состоит в том, чтобы встроить в алгоритм «умышленную слепоту», чтобы он одинаково относился к подгруппам независимо от традиционных различий, таких как раса, пол или социально-экономические факторы. Однако этот подход может не учитывать коррелированные переменные, что приводит к несправедливым результатам или проблемам с выборочными данными, используемыми для обучения модели.

Другой вариант — обеспечить статистическое равенство в решениях или результатах, например, выбрать равную долю людей как из защищенных, так и из незащищенных групп. Это можно сделать, установив разные пороговые значения для разных групп, чтобы обеспечить равенство результатов для каждой группы. Однако этот подход требует частой проверки и модификации порогов и может не учитывать основные различия в подгруппах.

Более сбалансированный подход к обеспечению справедливости заключается в том, чтобы сосредоточиться на производительности (или точности) алгоритма в разных группах, а не на результате решения. Это означает, что частота ошибок или распространенность ложноположительных или ложноотрицательных результатов для каждой группы одинакова с учетом различий в основной популяции. Например, процент одобренных соискателей кредита, подавших заявку в фонд Hustler.

Этот подход, известный как «прогнозирующее равенство», направлен на то, чтобы алгоритм не был непропорционально лучше или хуже при принятии решений для конкретных подгрупп. Однако этот подход может быть достигнут за счет более низкой общей точности, поскольку алгоритм может быть менее точным для определенных подгрупп с меньшим объемом данных.

Обеспечение справедливости в машинном обучении является важным фактором, особенно в государственном секторе, где решения, принимаемые алгоритмами, могут иметь существенное влияние на отдельных лиц и сообщества. Крайне важно тщательно продумать, какой подход к справедливости наиболее подходит для каждого случая использования, а также регулярно проверять и оценивать производительность алгоритма, чтобы убедиться, что он справедлив и непредвзят.

Объяснимость

В Кении важно, чтобы заинтересованные стороны понимали алгоритмы, используемые государственными приложениями ИИ, а также то, как и почему принимаются решения. Это связано с тем, что сочетание «человек плюс машина» часто может привести к лучшим решениям, чем любое из них по отдельности. Особенно важно иметь прозрачные алгоритмы при распределении ограниченного ресурса, такого как стипендии или разрешения. Однако также важно учитывать компромисс между объяснимостью и точностью. В некоторых случаях может потребоваться более понятный алгоритм, чтобы люди могли улучшить свои входные данные и повлиять на конечный результат, в то время как в других случаях точность является наиболее важным фактором. По мере роста доверия к приложениям ИИ среди пользователей может появиться возможность перейти к более сложным алгоритмам.

Более простые алгоритмы, использующие основанные на правилах эвристики или деревья решений, могут быть проще для объяснения, но более тонкие и сложные алгоритмы могут быть более точными или менее предвзятыми. Определяющий вопрос заключается в том, что важнее, чтобы люди понимали обоснование решения, или важнее быть точным. Ответ зависит от контекста. В некоторых странах, например, различные системы оценки кредитоспособности4 могут иметь самые разные последствия для способности человека получить кредит. В таких случаях более понятный алгоритм даст кандидатам возможность улучшить свои входные переменные, например, избежать просроченных платежей, чтобы со временем повлиять на их окончательные баллы. Напротив, если алгоритм точно идентифицирует пациентов с высоким риском развития рака, пациенты вряд ли будут заботиться о том, чтобы алгоритм был легко объяснен. Организации также могут рассмотреть возможность перехода к более сложным алгоритмам, как только пользовательская база лучше ознакомится с более понятными моделями и укрепит доверие к ним.

«Отличной модели машинного обучения самой по себе недостаточно. Его часто необходимо облечь в интуитивно понятный интерфейс, ориентированный на пользователя, и внедрить его в рабочий процесс». — Джон Вафула

Принятие

Чтобы эффективно использовать ИИ в кенийском правительстве, важно учитывать три ключевых аспекта: разработка модели или алгоритма, получение информации из его результатов и поощрение принятия его рекомендаций.

Просто иметь хорошо спроектированную модель машинного обучения недостаточно; он также должен быть интегрирован в рабочие процессы и представлен интуитивно понятным для пользователей способом. Этого можно достичь за счет использования дизайн-мышления и вовлечения в процесс сотрудников, работающих с клиентами. Однако алгоритмы машинного обучения могут быть отклонены из-за их способности генерировать точные, но противоречивые идеи, которые могут быть результатом использования большого количества переменных и данных.

Чтобы стимулировать внедрение, важно вовлечь целевых пользователей в процесс разработки и разработать простой способ доставки и использования идей модели. Внедрение может быть сложным, но оно необходимо для обеспечения успеха проектов ИИ. Это требует сквозного опыта, включая управление изменениями и развертывание операций, и может быть особенно сложным для групп аналитиков, работающих в государственном секторе или в партнерстве с поставщиками.