Персептрон для бинарного классификатора с функцией активации единичного шага

Влияние весов на визуализацию вывода с использованием электронной таблицы

В июле 1958 года пятитонный компьютер размером с комнату, IBM 704, смог отличить карты, отмеченные слева, от карт, отмеченных справа, после 50 попыток в процессе обучения, где это была демонстрация персептрона. , которая, по словам ее создателя Франка Розенблатта, является первой машиной, способной иметь оригинальную идею (Лефковиц, 2019). Персептрон представляет собой однослойную нейронную сеть или нейронную сеть, состоящую из взаимосвязанных персептронов (Александр, 2023). Он использует обучение с учителем для работы в качестве линейного бинарного классификатора (Шарма, 2017), который обучается классифицировать данные по одной из двух возможных категорий, помеченных как 0 или 1, истина или ложь, положительные или отрицательные (Бануля, 2023). Таблицу можно использовать для машинного обучения (Thin-Yin & Jonathan, 2020), но здесь она используется только как инструмент визуализации, чтобы показать влияние весов на результат.

Архитектура

Персептрон или однослойная нейронная сеть, используемая здесь, имеет два входных нейрона, x1 и x2, и один выходной нейрон y1 с весами w11 и w12.

Произведение затрат и весов дает

который позже обрабатывается с использованием функции активации для получения вывода

Функция активации f(z) имеет вид

которая известна как единичная ступенчатая функция (Trench, 2020), где b также будет варьироваться.

Электронная таблица

В качестве электронной таблицы используется Microsoft Excel, как показано на рисунке 2.

В ячейках с D3 по N13 размещается формула, например. для H8 выглядит следующим образом

=IF($Q$3*H$14+$Q$5*$C8 >= $Q$6, 1, 0)

который уже использует предыдущие уравнения. Обратите внимание, что есть три параметра, которые нужно изменять: w11, w12 и b. Эти параметры хранятся в ячейках Q3, Q4 и Q5.

Для аналогичных задач вы также можете использовать другие программы для работы с электронными таблицами, где некоторые из них обсуждаются с разными лучшими характеристиками (Абдуллахи, 2023).

b = -1

Для простоты значения b будут равны -1, 0, 1, и в этом разделе это будет первое значение. Тогда для w11 и w12 также будет одинаковая вариация значений.

b = 0

Могут быть варианты w11 (-1, 0, 1) и w12 (-1, 0, 1), которые дадут девять разных результатов.

b = 1

Как и в предыдущем разделе, также может быть девять вариантов.

подобный суперпозиции

Помимо предыдущих вариантов, ниже приведены другие, которые можно получить, но не ограничиваться ими.

На рисунке 5 показано наложение горизонтальных и вертикальных делений области, где самая левая фигура — это результаты.

Сдвиг

Существует также смещение деления по горизонтали и вертикали следующим образом.

На последнем рисунке видно, что также происходит смещение в диагональных направлениях.

инвертирование

Выход также можно инвертировать.

Инверсия областей вывода показана на рисунке 8, что может быть достигнуто путем замены знака изменения w11 и w12, поскольку области вывода субфигурок в первой строке инвертируются в области вывода субфигурок во второй строке.

Резюме

Из рис. 3–9 можно обобщить следующие пункты.

Значение w11 предназначено для деления области в направлении x1.
Значение w12 предназначено для деления области в направлении x2.
Изменение знака w11 и w12 инвертирует области.
Значение b сдвинет границу между двумя областями.
Гиперплоскость может быть только в виде x = c, y = c или y = ax + c.

Дополнительная информация

Рисунок 1 сделан с помощью Mermaid со следующим кодом

```mermaid
flowchart LR
  x1 --"w11"--> z1
  x2 --"w12"--> z1
  z1 --> y1
  x1(("x1"))
  x2(("x2"))
  z1(("z1 | f(z1)"))
  y1(("y1"))
```

а для таблицы это доступно здесь. Обратите внимание, что теперь формула уже изменилась, поскольку расположение ячеек на рис. 3–9 отличается от рис. 2.