Публикации по теме 'openai-gym'


Обучение с подкреплением: давайте научим такси водить
Обучение с подкреплением: давайте научим такси водить Обучение с подкреплением - это подраздел машинного обучения, задачи которого отличаются от стандартных способов обучения. В самом деле, вместо того, чтобы получать исторические данные и делать на их основе прогнозы или заключения, вы хотите, чтобы ваш алгоритм подкрепления учился с нуля из окружающей среды. По сути, вы хотите, чтобы он вел себя так же, как и в аналогичной ситуации (если вы хотите узнать больше о структуре RL,..

Как создать индивидуальную среду тренажерного зала с несколькими агентами
Вы хотите создать настраиваемую среду с несколькими агентами? Вы видели видео Open AI, где агенты сотрудничают, чтобы прятаться, и хотят сделать что-то подобное? тренажерный зал OpenAI - безусловно, лучший пакет для создания индивидуальной среды обучения с подкреплением. Он поставляется с некоторыми заранее созданными средами, но также позволяет нам создавать сложные пользовательские среды. Среда содержит все необходимые функции для запуска агентов и обучения. В этом руководстве..

Глубокое обучение с подкреплением: создайте глубокую Q-сеть (DQN) с помощью TensorFlow 2 и тренажерного зала для игры в CartPole
Давайте начнем с быстрого освежения знаний об обучении с подкреплением и алгоритме DQN. Обучение с подкреплением - это область машинного обучения, которая направлена ​​на обучение агентов выполнению определенных действий в определенных состояниях из среды , чтобы получить максимальное вознаграждение . Допустим, я хочу сделать бота для игры в покер (агента). Бот будет играть с другими ботами за покерным столом с фишками и картами (окружение). Этот бот должен иметь возможность..

Улучшите свою игру с помощью обучения с подкреплением в тренажерном зале OpenAI
Обучение с подкреплением в настоящее время является одним из самых многообещающих методов в машинном обучении и глубоком обучении . OpenAI Gym - один из самых популярных наборов инструментов для реализации сред моделирования обучения с подкреплением. Вот краткий обзор ключевой терминологии OpenAI Gym. Что такое OpenAI Gym OpenAI Gym - это библиотека с открытым исходным кодом, которая обеспечивает простую настройку и набор инструментов, включающий широкий спектр..

Алгоритмы обучения с подкреплением без использования моделей (часть 1)
Методы прогнозирования Монте-Карло с примерами кода Недавно я начал курс обучения с подкреплением под названием Move37 от Siraj Raval . Я закончил третью неделю курса, посвященного методам обучения с подкреплением методом Монте-Карло (MC). Ниже я собираюсь обобщить методы прогнозирования MC, используемые в обучении с подкреплением, а в следующих частях я расскажу о методах управления MC и обучения с временной разностью (TD), каждый из них с примерами кода. Итак, давайте погрузимся...

Индивидуальная среда Gym с агентами, которые сотрудничают
В предыдущей статье я объяснил, как создать среду ym Open AI с несколькими агентами. В этом я объясню, как заставить их сотрудничать для достижения общей цели: выйти из лабиринта! Весь код для этой статьи доступен на моем GitHub . Пользовательская среда Настраиваемая среда будет представлять собой лабиринт (похожий на тот, что был в предыдущей статье ), но с некоторыми изменениями. 0: Пустая область , агенты могут туда пройти 1: Агент 1 , который попытается..

Руководство для начинающих по пользовательским средам в спортзале OpenAI
Как настроить, проверить и использовать настраиваемую среду в обучении с подкреплением с помощью Python OpenAI’s Gym (со ссылкой на их веб-сайт): … набор инструментов для разработки и сравнения алгоритмов обучения с подкреплением . Он включает в себя моделируемые среды, начиная от очень простых игр и заканчивая сложными физическими движками, которые вы можете использовать для обучения алгоритмов обучения с подкреплением. Другой пакет OpenAI, Baselines , поставляется с рядом..