Что такое персептрон?

Знакомство со строительным блоком нейронной сети

Персептрон представляет собой алгоритм из области обучение с учителем и представляет собой базовый строительный блок нейронной сети. В своей простейшей форме он состоит из одного нейрона, который вычисляет выходное значение, используя взвешенные входные значения.

Основы искусственного интеллекта: контролируемое обучение
Контролируемое обучение — это подкатегория искусственного интеллекта и машинного обучения. Характеризуется тем, что…medium.com

Как работает персептрон?

Персептрон изначально представлял собой математическую модель и лишь позже стал использоваться в компьютерных науках и машинном обучении из-за его способности изучать сложные взаимосвязи. В простейшем виде он состоит ровно из одного так называемого нейрона, который имитирует строение человеческого мозга.

Персептрон имеет несколько входов, на которые он получает числовую информацию, т.е. числовые значения. В зависимости от приложения количество входов может отличаться. Входные данные имеют разный вес, который показывает, насколько входные данные влияют на конечный результат. В процессе обучения веса меняются для получения наилучших возможных результатов.

Затем сам нейрон формирует сумму входных значений, умноженных на веса входных данных. Эта взвешенная сумма передается в так называемую функцию активации. В простейшей форме нейрона имеется ровно два выхода, поэтому можно предсказать только бинарные выходы, например, «Да» или «Нет», «Активен» или «Неактивен» и т. д.

Если нейрон имеет бинарные выходные значения, используется функция, значения которой также находятся в диапазоне от 0 до 1. Примером часто используемой функции активации является сигмовидная функция. Значения функции варьируются от 0 до 1 и фактически принимают почти исключительно эти значения. За исключением x = 0, имеет место крутой рост и скачок от 0 до 1. Таким образом, если взвешенная сумма персептрона превышает x = 0 и персептрон использует сигмоиду в качестве функции активации, выход также соответственно изменяется от 0 до 1.

Какой пример иллюстрирует работу персептрона?

В качестве примера того, как работает персептрон, давайте подробнее рассмотрим работу политика. Она является членом парламента, и новый закон должен быть принят на голосование. Таким образом, политик должен решить, согласна она или не согласна с законопроектом (воздержание в нашем примере невозможно). Таким образом, персептрон имеет двоичный вывод, а именно одобрение или отклонение.

Существуют различные источники информации, доступные политикам для принятия решения. С одной стороны, есть информационный документ со справочной информацией, выпущенный парламентом. Кроме того, политик может узнавать о различных проблемах в Интернете или обсуждать их с коллегами. Политик взвешивает свой вклад, то есть свои источники информации, в зависимости от того, насколько они заслуживают доверия, по его мнению. Например, она придает относительно низкий вес парламентскому информационному бюллетеню, поскольку опасается, что исследование недостаточно подробное и уже должно иметь тенденцию к определенному направлению. Затем она берет сумму доступной ей информации вместе с весами и передает ее функции активации.

В данном примере мы можем представить это как голову нашего политика. Теперь она решает на основе входных данных, должна ли она согласиться с предложенным законом или нет. Даже небольшие детали во входных данных могут привести к резкому изменению мнения политика.

Что такое многослойный персептрон?

Эту простую модель уже можно использовать для многих приложений, но она быстро достигает своих пределов, когда дело доходит до понимания и изучения более сложных взаимосвязей. Поэтому на практике основное внимание уделяется нескольким слоям персептронов, которые затем собираются в так называемую искусственную нейронную сеть.

Интуитивное руководство по искусственным нейронным сетям
Искусственные нейронные сети (ИНС) — наиболее часто используемое модное слово в контексте искусственного интеллекта и…medium.com

Эти так называемые многослойные персептроны связаны друг с другом таким образом, что только первый слой нейронов получает входные данные извне сети. С другой стороны, в последующих слоях выходы предыдущих слоев служат входами для текущего слоя. Только нейроны в последнем слое нейронной сети являются выходами, которые затем используются как фактический результат.

Что касается нашего примера с политикой, мы могли бы более внимательно изучить источники информации политика. Например, информационный документ парламента состоит из работы различных научных сотрудников, чья взвешенная работа была включена в конечный продукт. В свою очередь, эти соавторы также могут быть представлены как отдельные персептроны в сети.

Что такое нейроны смещения?

В многослойных персептронах используются так называемые нейроны смещения. Это особые входные нейроны, которые, однако, не имеют внешнего значения, а принимают постоянное значение, которое также может изменяться в процессе обучения. Это позволяет сместить кривую функции активации вниз или вверх.

Смещение похоже на константу, используемую, например, в линейной регрессии, и помогает модели лучше соответствовать выходным значениям и, таким образом, улучшать результат.

Какие приложения используют персептроны?

Нейронные сети основаны на персептронах и в основном используются в области машинного обучения. Цель здесь в основном состоит в том, чтобы изучить структуры в предыдущих данных, а затем предсказать новые значения. Некоторые примеры:

Распознавание объектов на изображениях: Искусственные нейронные сети могут распознавать объекты на изображениях или присваивать изображениям классы. Компании используют это свойство в автономном вождении, например, для распознавания объектов, на которые должна реагировать машина. Другая область применения — медицина, когда рентгеновские снимки необходимо исследовать для выявления, например, ранней стадии рака.

Использование сверточной нейронной сети для классификации изображений
Сверточная нейронная сеть (CNN или ConvNet) — это подтип нейронных сетей, который в основном используется для…направления к науке о данных. ком

Анализ настроений клиентов. В Интернете у клиентов есть много каналов, чтобы опубликовать свои отзывы о бренде или продукте. Поэтому компаниям необходимо отслеживать, удовлетворены ли в основном клиенты или нет. С помощью нескольких обзоров, которые классифицируются как хорошие или плохие, можно обучить эффективные модели, которые затем могут автоматически классифицировать большое количество комментариев.
Обнаружение спама: во многих почтовых программах есть возможность помечать конкретные электронные письма как спам. Эти данные используются для обучения моделей Машинного обучения, которые напрямую помечают будущие электронные письма как спам, чтобы конечный пользователь их даже не видел.

Каковы преимущества и недостатки персептронов?

Использование перцептронов характеризуется следующими преимуществами и недостатками.

Преимущества

С помощью однослойных персептронов и особенно многослойных персептронов, так называемых нейронных сетей, можно изучать сложные прогнозы в области обучения с учителем.
В зависимости от данных количество входных данных можно легко увеличить, чтобы включить в прогноз различные релевантные значения.
Обученный персептрон относительно легко интерпретировать, а изученные веса можно использовать, чтобы сделать заявление о том, насколько важны входные данные.

Недостатки

Отдельные персептроны редко дают действительно хорошие результаты. Для мощных моделей обычно приходится создавать разные слои с большим количеством нейронов.
Многослойные персептроны особенно хорошо работают только с большими наборами данных.
Обучение многослойных персептронов обычно требует много времени и ресурсов.
Во многих слоях интерпретируемость весов теряется и возникает «черный ящик», хорошие предсказания которого невозможно объяснить.

Это то, что вы должны взять с собой

Персептрон — это алгоритм из области контролируемого обучения, представляющий собой основной строительный блок нейронной сети.
Когда отдельные персептроны строятся и соединяются в несколько слоев, это называется многослойным персептроном или нейронной сетью.
Персептрон состоит из входов, весов, функции активации и выходов.
Его можно использовать для изучения сложных взаимосвязей в данных и применения их к новым, ранее неизвестным данным.

Если вам нравится моя работа, подпишитесь здесь или загляните на мой сайт Data Basecamp! Кроме того, Medium позволяет вам бесплатно читать 3 статьи в месяц. Если вы хотите иметь неограниченныйдоступ к моим статьям и тысячам замечательных статей, не стесняйтесь получить членство за 5 долларов США в месяц, нажав на мою реферальную ссылку: https://medium.com/@niklas_lang/membership

Знакомство с базами данных NoSQL с помощью MongoDB
Практическое руководство по базам данных NoSQLtowardsdatascience.com

Понимание алгоритма обратного распространения
Познакомьтесь с основой искусственного интеллектаmedium.com

Руководство по градиентному спуску для начинающих
Все, что вам нужно знать о методе градиентного спускаtowardsdatascience.com