Глубокое обучение: секрет интеллекта

Вы когда-нибудь задумывались о том, как Netflix знает, какие шоу, сериалы, фильмы могут вас заинтересовать, или как Amazon знает, какие продукты вам могут понравиться заранее, или как Apple Siri, Google Voice Assistant или Microsoft Cortana понимает и помогает вам? Это не магия или какое-то колдовство, это скорее сложные алгоритмы, которые анализируют закономерности и человеческое поведение, которые затем обрабатываются для получения разумных результатов.

Искусственный интеллект заставляет компьютерную систему или робота думать как человек. Это набор алгоритмов, которые обучают компьютерную систему самообучению и наделяют ее интеллектом для принятия человеческих решений.

Глубокое обучение - это подраздел машинного обучения, которое далее относится к искусственному интеллекту. Машинное обучение - это набор алгоритмов, имитирующих структуру и функциональную единицу человеческого мозга. Данные - самый важный параметр для искусственного интеллекта. Возможно, нам удалось разработать алгоритмы, дающие очень точные результаты, но глубокое обучение может дать сбой, если не проверять качество данных. Например: чтобы классифицировать изображение собаки, должны быть изображения каждой породы собак и изображения других четвероногих животных, чтобы система научилась отличать собак от других животных.

Глубокое обучение было введено Риной Дехтер в 1986 году. Первое общее действующее алгоритмическое правило для контролируемого обучения, глубокого обучения, прямой связи и многослойных перцептронов было раскрыто Алексеем Ивахненко и Лапой в 1965 году, но оно не практиковалось и не соблюдалось из-за нехватки большой объем данных и оборудование для обработки данных. С развитием информационных технологий за последние два десятилетия было создано большое количество данных, и были разработаны быстрые вычислительные устройства, такие как GPU (графический процессор).

В последние годы глубокое обучение получило огромное развитие. Он используется в области компьютерного зрения, обработки естественного языка, распознавания речи, медицины, открытия лекарств, игр и анализа социальных сетей, где результаты были замечательными и высокомерными по сравнению с человеческим интеллектом. Благодаря своим достижениям в различных областях, он привлек внимание различных лидеров и экспертов бизнес-индустрии, которые продолжают в нем продвигаться. Очевидно, это самая обсуждаемая тема в индустрии.

Глубокое обучение отличается от традиционного машинного обучения, когда нам необходимо предоставлять функции в качестве входных данных для алгоритмов. Глубокое обучение может автоматически изучать функции на основе данных, таких как изображения, видео, текст, звук, без введения правил, написанных вручную, или знания человеческой области. Этот процесс глубокого обучения называется «извлечением признаков».

Глубокое обучение использует многослойные искусственные нейронные сети, состоящие из входного слоя, множества скрытых слоев и выходного слоя. Слово «глубокий» означает, что входные данные распространяются через множество слоев и преобразуются в абстрактное и составное представление. Каждый уровень содержит узлы, которые представляют часть информации на этом уровне.

Слой ввода содержит узлы, равные количеству измерений во входных данных. В каждом слое разное количество узлов. Количество узлов в выходном слое равно количеству классов в задаче классификации . Однако в задачах регрессии в выходном слое есть единственный узел . Узлы в скрытых слоях и выходных слоях параметризованы для абстрактной информации, т. е. особенности входных данных меняются во время обучения. Функции активации в каждом слое помогают преобразовать входные сигналы в выходные сигналы. Выходные сигналы одного слоя в дальнейшем используются как входные для другого слоя . Последний выходной слой дает окончательный результат .

Обучение - это просто обновление весов (параметров) узлов до новых, и обновление определяется функцией потерь (например, SVM, Softmax или Cross entropy Loss). Функция потерь определяется как разница между реальной стоимостью и оценочной стоимостью выпуска. Для точности требуется минимизация функции потерь. Значение потерь распространяется обратно на нейроны предыдущего слоя, где новое значение весов вычисляется с использованием текущих значений потерь. Этот процесс называется обратным распространением.

Машинное обучение

Входные данные - - - → Извлечение признаков - - - → Алгоритм - - - → Выход

Пример: (Изображение автомобиля) - - - → (Определенные характеристики) - - - → (Классификация) - - - → (Автомобиль или не автомобиль)

Глубокое обучение

[Входные данные] - - - → [Извлечение признаков + алгоритм] - - - → [Вывод]

Пример: (Изображение автомобиля) - - - → (Извлечение признаков + классификация) - - - → (Автомобиль или не автомобиль)

Искусственный интеллект и глубокое обучение - это будущее поколения компьютеров, в котором мы сделаем наши компьютеры достаточно интеллектуальными, чтобы выполнять повседневные задачи, которые в дальнейшем позволят человеческому интеллекту и мозгу решать более сложные задачи.