Вчера я закончил курс машинного обучения Эндрю Нг на Coursera. С сегодняшнего дня я хочу пройти первый курс специализации Эндрю — «Нейронные сети и глубокое обучение». Кажется, что эта серия специализаций охватывает более свежие темы машинного обучения по сравнению с традиционным МО Coursera. Я очень рад видеть, что я могу узнать из этих специализаций.
Обзор
Давайте сначала кратко рассмотрим последние тенденции в машинном обучении. Затем мы углубимся в темы по ходу курса.
РеЛУ
ReLU расшифровывается как Rectified Linear Unit. Эта функция заменила традиционную сигмовидную функцию в нейронных сетях. Функция ReLU выглядит следующим образом:
Оказывается, ReLU лучше, чем сигмовидная функция, потому что с помощью функции ReLU сети могут обучаться быстрее.
Нейронная сеть
Помимо стандартной нейронной сети существует два новых типа нейронных сетей — сверточная нейронная сеть (CNN) и рекуррентная нейронная сеть (RNN).
CNN особенно хорошо работает с распознаванием изображений и широко используется в компьютерном зрении. RNN очень хорошо работает с непрерывным потоком данных и очень полезен в таких приложениях, как обработка естественного языка.
Глубокое обучение
Почему глубокое обучение вдруг стало популярным? Идея нейронной сети уже существовала 20 лет назад. Это связано с увеличением объема данных и ростом вычислительной мощности компьютеров.
Как мы видим на графике выше, когда у нас было всего несколько данных, производительность нейронной сети ничем не отличалась от других простых алгоритмов обучения. Но чем больше у нас данных, мы можем легко увидеть, что производительность в какой-то момент перестает расти с традиционными алгоритмами обучения. Но производительность продолжает расти вместе с нейронной сетью. Таким образом, тенденция к глубокому обучению резко возросла, поскольку у нас появилось больше данных для обработки алгоритмов.
Это все на сегодня.