Что я изучаю и что было полезно

Я откладываю обучение с усилением обучения (RL) уже 2 года. Я думаю, настоящая причина в том, что есть чему поучиться. Так много конференций каждые две недели. Их статьи и каждая область интересны по-своему. Но здесь у меня наконец-то появилась возможность выделить какое-то время в своем календаре, чтобы каждую неделю учить немного RL.

Моя текущая стадия. У меня есть представление о том, что такое RL (определение высокого уровня) и все обсуждаемые вокруг него слова (например, RL без моделей, исследование и эксплуатация). Я никогда не проходил курс обучения RL в школе или онлайн.

Моя цель в конце этого пути - не очень амбициозен в отношении того, чего я хотел бы достичь, но, по крайней мере, я хочу иметь возможность понять текущее исследование. Что касается отрасли, я хотел бы разобраться в продуктах, в которых уже используется RL. Я также хотел бы знать вычислительную сторону таких вещей, как подводные камни последних библиотек и т. Д. Если мне повезет, я сделаю свою собственную диаграмму RL (они супер крутые) с агентом, средой, функцией вознаграждения и т. Д.!

Если вы хотите продолжить это путешествие со мной, напишите мне на адрес [email protected]. Наверное, мы можем чему-то научиться друг у друга. Или вы могли бы рассказать мне о более подходящих ресурсах!

1 день

Я начал с самого популярного курса по RL Дэвида Сильвера. К тому моменту, когда я пишу это, я уже закончил свою первую лекцию. Я знал в нем многое. В моей аспирантуре я взял курс по случайным процессам, одной из основных тем которого были марковские процессы. Глядя на курс (до сих пор), эти знания могут быть полезны. Пока все довольно оптимистично :)