Пять курсов Эндрю Нг направлены на то, чтобы дать новичкам и практикам ускоренный курс по всем аспектам глубокого обучения — от полностью подключенных нейронных сетей до сверточных сетей и моделей последовательностей. Я прошла все пять курсов и закончила четыре. (Я еще не закончил курс сверточных сетей, но я взял достаточно материала, чтобы написать обзор!)

Вот мой пошаговый обзор специализации Эндрю Нг по глубокому обучению.

Нейронные сети и глубокое обучение

Первый курс специализации посвящен строительным блокам глубокого обучения. В нем рассматривается логистическая регрессия, интерпретируемая как однослойная сеть, неглубокие сети и, наконец, глубокие сети как многоуровневые неглубокие сети.

Что ж, если вы прошли курс-предшественник Эндрю Нг «Машинное обучение», то первый курс «Глубокого обучения» — это, по сути, просто разработка части нейронной сети. Прелесть этого курса в том, что он сделан на чистом Python. Старый курс был написан на очень неудобном и малоиспользуемом языке под названием Octave (он же бесплатный Matlab), и изучение этого языка было уже полдела.

Для полного новичка этот курс абсолютно необходим для начала работы с глубоким обучением. Проходите этот курс снова и снова, пока не поймете все. Единственный недостаток, который у меня есть в этом курсе и во всех других курсах по специализации, если на то пошло, заключается в том, что упражнения с блокнотом Jupyter — это, по сути, просто упражнения для заполнения пробелов. Что-то более сложное определенно будет оценено по достоинству.

Рейтинг : 5/5

Улучшение глубоких нейронных сетей

Второй курс в последовательности короткий — всего три недели. Основное внимание уделяется деталям обучения нейронных сетей — различным типам регуляризации, алгоритмам оптимизации и настройке параметров. Он также кратко описывает среду программирования TensorFlow, возможно, самую популярную библиотеку глубокого обучения.

Честно говоря, я был просто шокирован тем, насколько глубоко и технично в курсе описаны детали обучения. Это точно не пешеходный маршрут. Тем не менее, методы были представлены таким образом, что это не совсем укладывалось в моем сознании. Курс представлял собой набор информации, которую было полезно знать, но на самом деле необязательно было осваивать на практике. Вы действительно собираетесь реализовать выпадающие слои или оптимизатор Adam на работе, но полезно знать, как они работают. Еще одна придирка, которую я имею, заключается в том, что охват TensorFlow был немного недостаточным. Для последовательности, которая призвана стать стартовой площадкой для карьеры в области глубокого обучения, обсуждение TensorFlow было слишком поверхностным.

Не скажу, что это обязательный курс для новичков. Здесь все хорошо известно, но не обязательно.

Рейтинг : 3/5

Структурирование проектов машинного обучения

Вау, этот курс длится всего две недели. Почему они просто не объединили его с предыдущим курсом? Этот курс посвящен стратегии машинного обучения, то есть тому, как настроить проект машинного обучения. В частности, на курсах рассказывается о том, как настроить разделение обучения и тестирования, определить метрику оптимизации, смещение, анализ отклонений и ошибок, а также новые парадигмы, такие как трансферное обучение.

Опять же, все здесь приятно знать, но не обязательно, как и второй курс, но лично я нашел здесь знания немного более важными, чем второй курс. В то время как второй был посвящен техническим аспектам обучения, этот курс был больше сосредоточен на практических аспектах создания проекта.

Рейтинг : 4/5

Сверточные нейронные сети

Четвертый и пятый курсы специализации, безусловно, являются звездами специализации. Если вас больше интересует работа с данными изображений, то этот курс для вас. Сети Conv находятся в центре внимания курса номер четыре. Вы узнаете о двух строительных блоках сверточных сетей, сверточном слое и слое объединения, а также о том, как наложение этих двух слоев друг на друга в основном дает вам потрясающую производительность в задачах классификации изображений. Вы также узнаете о различных известных на рынке конверсионных сетях: ResNets, VGG, Inception. Практические приложения, такие как обнаружение объектов и распознавание лиц, завершают курс.

Это единственный курс, который я еще не закончил. Извините, я просто не в восторге от работы с данными изображения. Однако не заблуждайтесь, лекции Эндрю Нг по основам консетей замечательны. Я смог полностью понять, как работает сверточная сеть в отличие от полносвязной ванильной модели. Этот курс — хорошее первое погружение в пространственные модели в глубоком обучении, и я планирую закончить курс в ближайшее время. Моей единственной придиркой, вероятно, будет охват различных конвергентных сетей на рынке. Эндрю Нг не смог объяснить их так, чтобы это было легко понять, и я просто отказался от этой части.

Рейтинг : 4/5

Модели последовательности

Последний курс в последовательности работает с последовательностями, без каламбура. Большинство приложений здесь подпадают под обработку естественного языка, но также обсуждаются некоторые приложения для создания музыки и распознавания речи. Здесь рассматриваются рекуррентные нейронные сети (RNN), сеть долговременной памяти (LSTM), модели встраивания, такие как Word2Vec и GloVe, и архитектуры последовательностей для трансляции и транскрипции.

Мне очень нравится работать с текстовыми данными, поэтому я получил огромное удовольствие от прохождения этого курса. До этого курса я никогда не мог полностью понять, что делает RNN. Первая неделя этого курса просто потрясающая, и Эндрю Нг смог очень информативно обсудить технические аспекты RNN. Это должно быть первым введением в RNN для всех — не читайте блоги! Они просто запутают вас. Секция по НЛП тоже была очень веселой. Покрытие word2Vec и анализ настроений были превосходными.

Однако третья неделя курса прошла немного в спешке. По сути, это была информационная перегрузка моделей последовательностей. Чтобы полностью обсудить поиск луча и механизм внимания, требуется гораздо больше уточнений. Это очень сложные модели!

Рейтинг : 4/5

Первоначально опубликовано на datameetsmedia.com 1 апреля 2018 г.