Введение

В этой краткой статье я стремлюсь выразить некоторые мысли относительно влияния системного мышления на проектирование и понимание систем искусственного интеллекта. Я считаю, что такое экспансионистское мышление (в отличие от редукционистского) дает возможность более ясно понять системы искусственного интеллекта.

Прежде всего, давайте рассмотрим определение систем. Следующая цитата и большинство других цитат в этой статье взяты из книги Донеллы Медоуз Мышление в системах: учебник для начинающих [1].

Система — это взаимосвязанный набор элементов, который связно организован таким образом, что достигает чего-то [1].

Это что-то в системе ИИ в основном является ее предполагаемой задачей(ями), например. классификация медицинских изображений, общение с пользователем или помощь в принятии решений. Однако из-за сложности систем могут возникнуть некоторые непредвиденные последствия. Например, исследователи Массачусетского технологического института обнаружили, что:

Модели [медицинской визуализации], которые в целом работают хорошо, дают сбои, когда дело касается подгрупп, для которых было собрано и использовано в процессе обучения относительно мало данных [2].

Хотя эти последствия являются непреднамеренными и нежелательными, мы должны помнить, что они являются естественным поведением системы ИИ текущего дизайна. В общем:

Система — это больше, чем сумма ее частей. Он может проявлять адаптивное, динамичное, целеустремленное, самосохраняющееся, а иногда и эволюционное поведение [1].

Поэтому всякий раз, когда модель медицинской визуализации страдает от предвзятости, модель чат-бота говорит злобно или беспилотный автомобиль ставит безопасность выше безопасности пешеходов, системное мышление может помочь нам смягчить эту проблему.

Характеристики систем искусственного интеллекта

Наша первая задача — идентифицировать элементы системы и их потенциальные взаимосвязи, одновременно устанавливая разумные границы с средой. На следующем рисунке показан образец, который я придумал.

  • Очевидно, что Набор данных и Модель обучения являются двумя основными компонентами системы ИИ, поскольку они придают системе идентичность.
  • Гиперпараметры, которые я определил как подсистему Программного обеспечения, можно считать точкой рычага системы. . то есть «места в системе, где небольшое изменение может привести к значительному изменению поведения [1]». Соответственно, корректируя гиперпараметры (например, скорость обучения) мы можем добиться гораздо лучших результатов.
  • При глубоком обучении элемент Извлечение функций обычно интегрируется в Модель обучения, что обеспечивает сквозной подход. Тем не менее, даже при глубоком обучении полезно выполнить некоторую предварительную обработку исходных данных.
  • Решение о том, попадает ли Оборудование (особенно для обучения) в пределы системы, имеет существенное значение. В этом отношении, используя облачные сервисы (например, Amazon SageMaker), мы можем ошибочно игнорировать климатические последствия систем искусственного интеллекта.
  • Обеспечивая связь между ключевыми показателями эффективности (например, точностью модели) и поставщиком данных (пунктирная линия на рисунке), мы создаем цикл обратной связи. в системе со многими преимуществами, которые я объясню в следующем разделе.
  • Еще одна преобразующая взаимосвязь — от Набора данных до KPI, позволяющая настроить эффективность обучения на основе данных. Ярким примером такой взаимосвязи является расчет KPI для каждой подгруппы (например, мужчин и женщин), проведенный в [2].
  • Вполне вероятно, что есть некоторые важные элементы или взаимосвязи, которые я забыл включить в этот дизайн. Есть ли у вас какие-либо мысли, которыми вы хотели бы поделиться?

Ориентированный на данные ИИ

Формирующаяся парадигма ИИ, ориентированного на данные, определяется как:

систематическая обработка данных для создания более эффективных систем искусственного интеллекта [3].

Примером этой парадигмы является Активное обучение (т. е. выбор наиболее информативных данных для последующей маркировки). Предположим, что в беспилотном автомобиле вы можете заметить проблему, скажем, модель плохо работает в туннелях (следующий рисунок). Таким образом, сама система (а не разработчик) запрашивает конкретные данные через петлю обратной связи от KPI поставщику данных. Петля обратной связи по сути представляет собой «замкнутую цепочку причинно-следственных связей [1]».

Тем не менее, хотя этот подход, как ожидается, улучшит поведение системы, могут возникнуть проблемы, включая задержку. Если система постоянно запрашивает данные, может оказаться сложно определить влияние каждого подмножества набора данных.

Рекомендации

[1] Медоуз, Донелла Х. Системное мышление: учебник. Издательство Челси Грин, 2008.

[2] Как модели машинного обучения могут усилить неравенство в медицинской диагностике и лечении, новости MIT (ссылка)

[3] Data-ориентированный ИИ против модельно-ориентированного ИИ (ссылка)