2022/10/03

Я взял себя в руки после суматошного дня и заставил себя написать сегодняшний дневник. Я собираюсь тренировать модель для Atari Boxing. У меня не было достаточно времени, чтобы пройтись по деталям и настройке модели RL. Поэтому я постараюсь записать, как проходит общий рабочий процесс. Окружение коллаб.

Сначала скачайте необходимые библиотеки

Импорт библиотек

Создайте среду Atari Boxing и перезагрузите ее.

Пространство действия Atari предопределено таким образом.

Подробности:





Пространство наблюдений: «По умолчанию среда возвращает изображение RGB, которое отображается игрокам-людям в качестве наблюдения. Однако можно наблюдать»

Теперь давайте обучим простую модель.

Скачать необходимые библиотеки для визуализации

Играйте случайным образом, пока игра не закончится.

Результат:



Теперь давайте попробуем модель с обученной сетью.

Сначала мы должны переопределить среду

Давайте попробуем PPO. Мы будем тренировать его на 10 тысяч шагов.

Теперь давайте поиграем.

Результат:



Определенно есть улучшения!

Это столько, сколько позволяет мне время сегодня. Сегодня был сумасшедший день. Я постараюсь изо всех сил жить в соответствии со стоической философией и не лениться завтра.