Публикации по теме 'k-armed-bandit'


Введение в RL
Оценка и разведка Добро пожаловать в первую публикацию из серии статей об обучении с подкреплением. Меня очень интересует область безопасности искусственного интеллекта, и я считаю, что очень важно хорошо понимать RL, среди прочего, для решения проблем в области безопасности искусственного интеллекта. Я использую невероятную работу Ричарда С. Саттона и Эндрю Дж. Барто «Обучение с подкреплением: введение» в качестве основного источника обучения. Чтобы действительно обосновать свое..