Вопросы по теме 'rllib'
Как распечатать распределения действий в RLlib во время обучения?
Я пытаюсь распечатать распределения действий в конце каждого эпизода, чтобы увидеть, что делает мой агент. Я попытался поставить это rock_paper_scissors_multiagent.py, включив следующий метод
def on_episode_end(info):
episode =...
1087 просмотров
schedule
09.01.2023
Есть ли способ обучить PPOTrainer в одной среде, а затем завершить обучение в слегка измененной среде?
Я пытаюсь сначала обучить PPOTrainer на 250 итераций в простой среде, а затем закончить обучение в модифицированной среде. (Единственная разница между средами - это изменение одного из параметров конфигурации среды).
До сих пор я пробовал...
146 просмотров
schedule
21.04.2023