CNN — это форма искусственной нейронной сети (ANN). CNN имеет скрытые слои, называемые сверточными слоями (на самом деле имеет как сверточные, так и несверточные слои, но сверточные слои составляют основу CNN).

Чем же он отличается от персептрона в ИНС?

CNN имеет скрытые слои, называемые «сверточными слоями». Операция, выполняемая в этих слоях, называется «сверткой». Эти сверточные слои отвечают за обнаружение шаблонов. В каждом слое есть «фильтры». Эти фильтры фактически отвечают за обнаружение закономерностей в изображениях. Что именно вы подразумеваете под «схемой»? Изображение может содержать несколько объектов, текстур, краев и форм. Одним из типов шаблонов, которые может обнаружить фильтр, могут быть края. Тогда такой фильтр будет называться «детектором краев». Фильтры, видимые в первых нескольких слоях CNN, довольно просты и могут использоваться для обнаружения форм или краев на изображениях. В то время как более глубокие слои фильтра более сложны и способны обнаруживать определенные объекты, такие как глаза, уши, волосы и т. д., а еще более глубокие слои способны обнаруживать еще более сложные объекты, такие как полное изображение собак, кошек, яблок и т. д.

Углубляясь в работу этих слоев.

Мы должны указать количество фильтров в каждом из слоев свертки. Каждый фильтр представляет собой небольшую матрицу, в которой мы можем определить количество строк и столбцов. Значения в матрице инициализируются случайными числами. Предположим, мы установили матрицу 3x3 для первого слоя свертки. Затем эта матрица будет скользить по каждому блоку пикселей 3x3 в полученном изображении, и коэффициенты матрицы будут умножены на коэффициенты значений пикселей изображения. Матрица будет скользить по каждому блоку пикселей 3x3 в изображении, пока все изображение не будет завершено. Эта скользящая операция называется «свертыванием». Таким образом, мы можем сказать, что фильтр 3x3 свёртывается с каждым из блоков 3x3 пикселей изображения.

Каждое значение в выходной матрице будет скалярным произведением матрицы фильтра на каждый блок пикселей из входного изображения. Полученная матрица скалярного произведения является выходом этого слоя и будет действовать как вход для следующего слоя. Тот же процесс в предыдущем слое будет повторяться и в следующем слое.

Иллюстрации всегда помогают при изучении CNN. Это видео дает четкое объяснение.

Для лучшего понимания работы свертки посмотрите это видео.

Хорошего дня!