Многие алгоритмы программного обеспечения компьютерного зрения изначально используют простую нейронную сеть для сортировки входных данных по двум или более категориям, упрощая задачу до нескольких нейронных сетей. Исходная нейронная сеть обычно состоит всего из нескольких слоев и пытается получить приблизительную оценку, чтобы отсортировать входное изображение в массив оптимизированных нейронных сетей.

После того, как вход классифицирован, он передается в специализированную нейронную сеть, которая лучше подходит для того, чтобы делать выводы по изображению. Наличие нескольких специализированных нейронных сетей часто оказывается более практичным, чем обучение одной массивной сети каждому возможному решению. Кроме того, вместо переобучения всей сети при изменении масштаба проблемы проще просто добавить новую сеть в алгоритм и переобучить начальную классификационную сеть.

Одним из недостатков предыдущего метода является необходимость обучения и переобучения исходной нейронной сети, когда требуются изменения, особенно если данных для обучения не хватает. Альтернативой этому подходу является использование другого алгоритма для начальной классификации, такого как алгоритм инверсии, аналогичный следующему:



Подход минимизации методом наименьших квадратов эффективен, поскольку каждой нейронной сети может быть назначена линия наилучшего соответствия, которая находится путем взятия средней линии регрессии методом наименьших квадратов. После того, как каждой нейронной сети назначена регрессия и для входного изображения создана еще одна линия регрессии методом наименьших квадратов, все, что нужно сделать алгоритму, — это найти модель с наименьшей разницей во входных данных и передать изображение этому конкретному нейрону. сеть.

Алгоритм инверсии имеет множество преимуществ, в первую очередь отсутствие необходимого обучения. Все, что нужно точному алгоритму инверсии, — это подогнанная модель, которая на практике — это просто вектор.

Еще одним преимуществом алгоритма инверсии является его способность различать изображения с использованием усредненных значений, таких как общий свет, поляризованный свет, частоты RGB и многие другие, в зависимости от типа используемых датчиков. Это отличается от нейронной сети компьютерного зрения, которая анализирует расположение пикселей и узоров на изображении. Это важно, поскольку позволяет сортировать потенциально похожие изображения в разных нейронных сетях. Это было бы подобно тому, как если бы человек различал апельсин и яблоко, пассажирский поезд и товарный поезд. Хотя нейронная сеть может преуспеть в обоих примерах, изменение масштаба проблемы может быть прагматичным. Вместо этого пропуская апельсин и пассажирский поезд в одну сеть, а яблоко и товарный поезд в другую. Сети будут значительно точнее при различении двух непохожих изображений. Очевидно, что это будет иметь разную степень успеха, особенно если изображение передается в неправильную нейронную сеть, например, пассажирский поезд, передаваемый в сеть грузовых яблок, скорее всего, приведет к ответу грузового поезда, но в зависимости от других значений изображение, такое как цвет и яркость, инверсия может различать с более высокими показателями успеха.

Наконец, последним преимуществом будет устранение маловероятных исходных данных. Изображение с аномальной линией регрессии может быть легко исключено из алгоритма, и если модель предназначена для обнаружения определенных закономерностей во входных данных, вероятно, что многие из изображений не будут содержать ничего ценного для исследователя и эффективной работы. удаление неверных данных позволит алгоритму сосредоточиться на входных данных с более высокой вероятностью успеха.