Публикации по теме 'rl-textbook'


Введение, MDP — Обучение с подкреплением #1
Введение в обучение с подкреплением 3 вида машинного обучения Обучение под наблюдением (полу) Неконтролируемое обучение Обучение с подкреплением 1. Определение Обучение с подкреплением — это один из видов машинного обучения, когда агент учится взаимодействовать с окружающей средой, чтобы максимизировать некоторое понятие кумулятивного вознаграждения. 2. Фоновая концепция (a) Обучение под наблюдением: «учиться на примерах» Вот несколько примеров хорошего или плохого,..