Поскольку системы искусственного интеллекта становятся все более сложными, единой монолитной архитектуры агента часто оказывается недостаточно для выполнения реальных задач.

Многие задачи требуют разнообразного набора навыков, знаний и поведения, выходящего за рамки возможностей любой отдельной системы.

В таких случаях многообещающим подходом является координация децентрализованного роя агентов ИИ, каждый из которых обладает специализированным опытом, и сотрудничающих вместе для достижения общих целей.

В этой статье мы рассмотрим, как спроектировать и организовать гетерогенный рой агентов ИИ.

Ключевые возможности агентов LLM

Прежде чем погрузиться в структуру Swarm, давайте обрисуем некоторые ключевые возможности, которые имеют решающее значение для агентов LLM:

  • Понимание инструкций. Агент должен понимать инструкции и цели пользователя на естественном языке.
  • Планирование и обоснование. Агент должен разработать стратегию и определить действия, необходимые для достижения целей.
  • Получение знаний. Агенту необходимо собирать информацию из сред и внешних источников знаний.
  • Взаимодействие. Агент должен участвовать в многоходовых диалогах и предпринимать действия, влияющие на окружающую среду.
  • Адаптация. Агент должен корректировать свое поведение на основе отзывов окружающей среды и вознаграждений.

Модульная структура для агента

Предлагаемая нами структура состоит из четырех ключевых модулей — профиля, памяти, планировщика и исполнителя:

Профильный модуль

Этот модуль инкапсулирует атрибуты агента, такие как имя, личность, возможности, предпочтения и т. д. Профилирование делает агента более человечным и формирует его поведение. Профили могут быть определены или созданы.

Модуль памяти

Модуль памяти хранит опыт агента, историю диалогов и знания. Это обеспечивает контекст для рассуждений и последовательности в многоходовых взаимодействиях. Память может быть структурированной и неструктурированной.

Модуль Планировщика