Вопросы по теме 'rllib'

Как распечатать распределения действий в RLlib во время обучения?
Я пытаюсь распечатать распределения действий в конце каждого эпизода, чтобы увидеть, что делает мой агент. Я попытался поставить это rock_paper_scissors_multiagent.py, включив следующий метод def on_episode_end(info): episode =...
1087 просмотров
schedule 09.01.2023

Есть ли способ обучить PPOTrainer в одной среде, а затем завершить обучение в слегка измененной среде?
Я пытаюсь сначала обучить PPOTrainer на 250 итераций в простой среде, а затем закончить обучение в модифицированной среде. (Единственная разница между средами - это изменение одного из параметров конфигурации среды). До сих пор я пробовал...
146 просмотров
schedule 21.04.2023