Глубокое обучение, по крайней мере, последние 5 лет, находится на вершине списка модных словечек в технологиях. Он стал настолько популярным, что в наши дни термины «искусственный интеллект» и «глубокое обучение» стали синонимами. Огромная шумиха вызвана тем, что такое глубокое обучение и на что оно способно. Но, как это часто бывает, большая часть этой шумихи не совсем соответствует действительности. В этом посте давайте сделаем шаг назад и посмотрим, что именно делает глубокое обучение и что оно может.

Что такое глубокое обучение? (Действительно!)

Архитектура глубокого обучения или нейронных сетей использовалась для решения множества проблем в различных областях, таких как зрение, обработка естественного языка. Такие архитектуры, как LeNet, VGG-16, Inception, стали частью повседневных инструментов почти каждого практикующего специалиста. Некоторые из этих архитектур имеют очень глубокую структуру, в которую встроено много сложностей. Взгляните на схему сети Inception V3, чтобы убедиться, что она действительно сложна!

Это все пугает, но позвольте нам воспользоваться моментом, чтобы рассмотреть, что на самом деле делает модель глубокого обучения. Если вы спросите меня, он делает то же самое, что и любой другой алгоритм машинного обучения. По сути, он преобразует вектор более высокой размерности и преобразует его в вектор более низкой размерности. Векторы высокой размерности - это векторизованные представления входных данных, а вектор низкой размерности - это выходной вектор. С математической точки зрения DeepNet - это просто функция, которая преобразует входной X в выходной Y. Вот и все! Это действительно так просто, народ!

Возникает естественный вопрос: а как насчет этой зацикленной структуры раньше? Что именно это делает? Что ж, ответ на этот вопрос тоже прост. Одно из основных различий между машинным обучением и глубоким обучением заключается в том, что в машинном обучении извлечение признаков выполняется вручную, в то время как в глубоком обучении функции извлекаются самой моделью. В структуре Inception, VGG, ResNet и т. Д. Сложные части сети обычно заняты только извлечением функций . После этого концептуально нейронная сеть выполняет то же сопоставление, что и любой другой алгоритм машинного обучения, плюс, возможно, добавляет к нему немного нелинейности.

Одного глубокого обучения недостаточно!

Глубокое обучение никоим образом не может имитировать человеческий интеллект. Мы все еще далеки от создания систем, обладающих интеллектом человеческого уровня. И я считаю, что одного глубокого обучения недостаточно для достижения этой цели . Основные причины, по которым я придерживаюсь этого мнения, перечислены ниже:

  1. Модели глубокого обучения не «понимают» данные. Модель глубокого обучения не «понимает» данные так, как мы. Я бы сказал, что модель DL «запоминает» данные. Любая модель в машинном обучении просто видит числа и выплевывает числа. Настоящий интеллект будет достигнут только тогда, когда модель сможет связать некоторые «знания» с данными. Модель должна «учиться» в окружающей среде и со временем становиться лучше.
  2. Модели глубокого обучения требуют безумного количества данных. Практически каждый, читающий это, наверняка знает, какой объем данных требуется для обучения глубокой модели. Даже для тривиальной задачи построения классификатора изображений для идентификации кошек от собак на этапе обучения требуется около 2 ГБ изображений, что слишком много для такой тривиальной задачи. Нам не нужно было видеть 1000 собак и кошек, чтобы распознать, что есть что.

3. Модели глубокого обучения недостаточно обобщают. Не поймите меня неправильно. Я согласен с тем, что модели глубокого обучения допускают разумные обобщения. Мой аргумент здесь в том, что этого недостаточно. Для истинного «интеллекта» нам потребуется крайнее обобщение по сравнению с локальным обобщением, достигаемым современными методами. глубокие моды сегодня.

Хорошо! Что теперь?

К этому времени я надеюсь, что убедил читателей, почему я считаю, что глубокого обучения недостаточно для достижения настоящего «интеллекта». Это все еще вызывает вопрос: так как же нам достичь «интеллекта». Честно говоря, я не знаю наверняка, но у меня есть несколько идей, которые могут помочь повысить эффективность обучающих алгоритмов.

  1. Поиск универсального представления данных. Одна из безумных идей, которые, как я считаю, могут помочь в достижении интеллекта человеческого уровня, - это унификация представления данных. Если агент видел и понимал данные как абстрактные объекты с соединяющими их логическими связями, мы сможем заставить агентов изучить эти логические связи и получить богатое «знание» мира. Вместо того, чтобы концентрироваться на «модели», возможно, нам следует сконцентрироваться на том, как «представить» данные в нашей модели. Если задуматься, человеческий разум создает такие модели рассуждений и абстрактные модели окружающего нас мира, и это ключевая причина нашего «интеллекта».
  2. Нейронная коммуникация: это еще одна идея, вдохновленная человеческим мозгом. В нашем мозгу есть отдельные, отдельные области для работы со зрением, речью и т. Д. Другой ключевой аспект того, как работает наш мозг, - это связь между различными центрами. Если мы сможем связать две или более архитектуры нейронных сетей таким образом, чтобы они передавали «знания», которые они получали, и взаимодействовали между собой, то мы делаем шаг к созданию человеческого ИИ.
  3. Обучение на протяжении всей жизни. Следующее поколение интеллектуальных систем должно быть оснащено непрерывным обучением. С точки зрения глубокого обучения представьте себе нейронную сеть, которая продолжает обучение. Он может успешно изучить новые связи между объектами, и, что наиболее важно, снизить зависимость «интеллекта» от большого количества данных и вложить его в «развивающиеся данные».

Мораль истории

Подводя итог, можно сказать, что у глубокого обучения слишком много ограничений, чтобы имитировать сильный ИИ человеческого уровня. Глубокое обучение должно быть дополнено концепциями абстрактных моделей, коммуникацией между моделями об этих абстрактных конструкциях и политикой обучения на протяжении всей жизни, чтобы быть сопоставимым с интеллектом человеческого уровня. Очень отрадно знать, что исследователи во всем мире уже начали двигаться в этих направлениях. Некоторые из них уже показали очень убедительные результаты. Я надеюсь, что этот пост оставил у вас несколько идей, которые вы можете взять домой и обдумать. До следующего раза, прощай.