Публикации по теме 'rl-textbook'
Введение, MDP — Обучение с подкреплением #1
Введение в обучение с подкреплением
3 вида машинного обучения
Обучение под наблюдением (полу) Неконтролируемое обучение Обучение с подкреплением
1. Определение
Обучение с подкреплением — это один из видов машинного обучения, когда агент учится взаимодействовать с окружающей средой, чтобы максимизировать некоторое понятие кумулятивного вознаграждения.
2. Фоновая концепция
(a) Обучение под наблюдением: «учиться на примерах»
Вот несколько примеров хорошего или плохого,..