Публикации по теме 'contra-3'


Пользовательские модели с базовыми показателями: IMPALA CNN, CNN с функциями и сложный режим Contra 3
В прошлом месяце у OpenAI был интересный пост в блоге и бумага по обобщению в Reinforcement Learning (RL). OpenAI создал среду под названием CoinRun для проверки возможностей различных агентов по обобщению. CoinRun — это среда, похожая на видеоигру, в которой агент должен перемещать персонажа через различные препятствия, чтобы получить монету. В статье отмечалось, насколько производительность сверточной нейронной сети (CNN) IMPALA была выше, чем у Nature CNN (CNN по умолчанию в..