Недавно мне и моим товарищам по команде было поручено поработать над самоорганизующимися картами (SOM). Поработав над SOM, можно легко понять, почему они существуют и какие возможности они предоставляют для уменьшения размерности. SOM — если не сказать больше — это увлекательный аспект искусственной нейронной сети. Читайте дальше, чтобы получить краткий обзор о самоорганизующихся картах.

Введение

Самоорганизующиеся карты, также известные как SOM или карты Кохонена, представляют собой тип искусственной нейронной сети, используемой для обучения без учителя. Они были разработаны Теуво Кохоненом в 1980-х годах и с тех пор стали популярным инструментом для визуализации данных и распознавания образов.

Самоорганизующиеся карты (SOM) уже почти 40 лет используются в различных прикладных областях, таких как биология, геология, здравоохранение, промышленность и гуманитарные науки, в качестве интерпретируемого инструмента для изучения, кластеризации и визуализации многомерных наборов данных.

Основная идея самоорганизующейся карты заключается в создании низкоразмерного представления многомерных данных. Сеть состоит из узлов, также называемых нейронами, расположенных в двумерной сетке. С каждым узлом связан вектор веса, который определяет его положение в сетке.

Что такое SOM?

Самоорганизующаяся карта (SOM) — это модель кластеризации, которая вводит топологические отношения между кластерами. Он состоит из сети из двух слоев: входного слоя и выходного слоя взаимосвязанных узлов, часто называемых нейронами или единицами.

Обычно топология этого слоя выбирается как двумерная сетка, потому что ее легко визуализировать. Эта возможность визуализации характеризует SOM как интерпретируемый метод кластеризации.

В процессе обучения SOM учится упорядочивать входные данные по сходству их признаков. Это означает, что узлы, расположенные близко друг к другу в сетке, будут реагировать на одинаковые входные шаблоны. Другими словами, SOM отображает входные данные в двумерную сетку, где соседние узлы представляют аналогичные входные шаблоны.

Тренировочный процесс является повторяющимся и включает в себя три основных этапа: соревнование, сотрудничество и обновление веса. На этапе конкуренции соседей сеть выбирает узел, ближайший к входному шаблону, и все соседние узлы также активируются. На этапе обновления/корректировки весов веса активированных узлов корректируются, чтобы лучше соответствовать входному шаблону.

Итак, вместо того, чтобы иметь дело с сотнями строк и столбцов (кто бы этого хотел!), данные обрабатываются в упрощенную карту; это то, что мы называем самоорганизующейся картой. Карта предоставляет вам двумерное представление точно такого же набора данных; тот, который легче читать.

В следующем примере показано, как на узлы карты влияет кластер, к которому они находятся, и следует отметить, что только несколько узлов привлекаются к одному кластеру.

Приложения

Самоорганизующиеся карты имеют множество применений, включая визуализацию данных, кластеризацию и обнаружение аномалий. Они особенно полезны для визуализации многомерных данных, таких как изображения или текст, поскольку они могут создать низкоразмерное представление, сохраняющее структуру данных.

  • SOM использовались во многих приложениях; чаще всего в системах технического зрения для векторного квантования.
  • Автономные навигационные системы роботов на основе зрения исторически используют заранее определенные модели окружающей среды.

SOM особенно полезны для исследовательского анализа данных, где они помогают выявить закономерности и взаимосвязи в данных, которые могут быть неочевидны сразу. Они также позволяют исследователям визуализировать многомерные данные в двух или трех измерениях, что упрощает интерпретацию и передачу результатов.

ПРИМЕЧАНИЕ. Подробный обзор работы и производительности SOM будет опубликован в ближайшее время. Я обновлю ссылку в этом обзоре, как только документ будет готов