Google учит свой ИИ мечтать. И мы на шаг ближе к мыслящему, мечтающему стаду андроидов в человеческой плоти из Мира Дикого Запада.

Используя инструмент неконтролируемого подкрепления и вспомогательного обучения (UNREAL), исследователи из Google DeepMind могут применять те же ситуации, которые заставляют животных видеть сны в искусственном интеллекте. В том же приложении Google использовал те же методы глубокого обучения с подкреплением, которые он использовал, чтобы научить свой ИИ осваивать игру Го в январе.

Сон, как объясняется в статье Усиленное обучение с неконтролируемыми вспомогательными задачами исследователей DeepMind, является еще одним эффективным механизмом воспроизведения опыта, который оказался эффективным способом повышения как эффективности данных, так и стабильности глубоких знаний. алгоритмы обучения с подкреплением. Намерение состоит в том, чтобы помочь агенту искусственного интеллекта постоянно делать оценочные суждения между хорошими решениями и плохими. Еще один быстрый способ научить ИИ набирать призовые очки в игре Labyrinth (игра, разработанная исследователями DeepMind, в которой игроку нужно перемещаться по лабиринту и собирать яблоки). Сны предназначены для подкрепления агента. о максимизации вознаграждения и изменении окружающей среды в процессе.

В недавней статье, опубликованной исследователями Deep Mind, сны, кажется, достигли значительного скачка в производительности и достижениях системы.

(Перепост из Linkedin Pulse: https://www.linkedin.com/pulse/why-google-teaching-its-ai-dream-tannistho-ghosh?trk=pulse_spock-articles)