2022/10/03
Я взял себя в руки после суматошного дня и заставил себя написать сегодняшний дневник. Я собираюсь тренировать модель для Atari Boxing. У меня не было достаточно времени, чтобы пройтись по деталям и настройке модели RL. Поэтому я постараюсь записать, как проходит общий рабочий процесс. Окружение коллаб.
Сначала скачайте необходимые библиотеки
Импорт библиотек
Создайте среду Atari Boxing и перезагрузите ее.
Пространство действия Atari предопределено таким образом.
Подробности:
Пространство наблюдений: «По умолчанию среда возвращает изображение RGB, которое отображается игрокам-людям в качестве наблюдения. Однако можно наблюдать»
Теперь давайте обучим простую модель.
Скачать необходимые библиотеки для визуализации
Играйте случайным образом, пока игра не закончится.
Результат:
Теперь давайте попробуем модель с обученной сетью.
Сначала мы должны переопределить среду
Давайте попробуем PPO. Мы будем тренировать его на 10 тысяч шагов.
Теперь давайте поиграем.
Результат:
Определенно есть улучшения!
Это столько, сколько позволяет мне время сегодня. Сегодня был сумасшедший день. Я постараюсь изо всех сил жить в соответствии со стоической философией и не лениться завтра.