Публикации по теме 'alphastar'


Бенчмарк AlphaStar от DeepMind улучшает автономный агент RL с 90% процентом побед по сравнению с SOTA AlphaStar…
StarCraft II — одна из самых сложных сред для обучения с подкреплением (RL), она требует от агентов RL разумного стратегического планирования на долгосрочную перспективу с выполнением в реальном времени. В то время как онлайн-алгоритмы обучения с подкреплением (RL) добились больших успехов за счет обучения в сложных условиях, для большинства реальных приложений агентам RL требуется обучение в автономном режиме, что требует более сложного автономного эталонного теста RL для обучения..