Публикации по теме 'computer-vision'


Слои сверточной нейронной сети
Если мы хотим, чтобы машины думали, нам нужно научить их видеть. - Фей Фей Ли, исследователь искусственного интеллекта в Стэнфордском университете. В предыдущей главе этой серии мы представили простое введение в сверточную нейронную сеть (CNN), которая является основным строительным блоком большинства, если не всех алгоритмов компьютерного зрения. В этой главе мы познакомимся с жизненно важными слоями, которые составляют нашу повседневную CNN. Сверточный слой Наиболее..

Pixel2Style2Pixel: новая архитектура кодировщика улучшает преобразование изображения лица в изображение
В недавно опубликованной статье Кодирование в стиле: кодировщик StyleGAN для преобразования изображения в изображение исследователи из Penta-AI и Тель-Авивского университета представляют общую структуру преобразования изображения в изображение, получившую название Pixel2Style2Pixel ( pSp). В отличие от предыдущих методов, в которых используются специализированные архитектуры для конкретных задач, предлагаемая структура предназначена для решения широкого круга задач преобразования..

Обнаружение ключевых точек лица с помощью пирадокса
Pyradox - это библиотека Python, которая помогает вам реализовать различные современные нейронные сети полностью настраиваемым образом с помощью TensorFlow 2. Что такое ключевые моменты для лица? Ключевые точки лица также называются лицевыми ориентирами, которые используются для локализации и представления выступающих областей лица, таких как: глаза, брови, нос, рот, линия подбородка и т. Д. Ориентиры лица были успешно применены для выравнивания лица, оценки положения головы. , смена..

Введение в угловой детектор Харриса
Детектор углов Harris - это оператор обнаружения углов, который обычно используется в алгоритмах компьютерного зрения для извлечения углов и определения особенностей изображения. Впервые он был представлен Крисом Харрисом и Майком Стивенсом в 1988 году после усовершенствования углового детектора Моравека. По сравнению с предыдущим, детектор углов Харриса учитывает разницу угловых оценок напрямую по отношению к направлению, вместо использования смещаемых участков для каждых 45-градусных..

Патчи - все, что вам нужно?
Архитектуры преобразователей изображений (ViT) достигли непревзойденной производительности при решении многих задач компьютерного зрения, часто превосходя классические сверточные архитектуры. Возникает вопрос: является ли впечатляющая производительность ViT результатом их мощной трансформаторной архитектуры и механизмов внимания, или есть какой-то другой фактор, который дает ViT преимущество? В статье Патчи - это все, что вам нужно , которая в настоящее время проходит двойную слепую..

В чем разница между обнаружением объектов и сегментацией изображений?
А когда какой использовать? Обработка изображений в искусственном интеллекте Искусственный интеллект выполняет разные задачи для обработки изображений. В этой статье я расскажу о различиях между обнаружением объектов и сегментацией изображений. В обеих задачах мы хотим найти на изображении расположение определенных элементов, представляющих интерес. Например, у нас может быть набор изображений с камеры наблюдения, и на каждом изображении мы хотим идентифицировать местоположения..

Компьютерное зрение: от проекта летнего стажера к новому определению будущего ИИ
Приблизительно 1966: Марвин Мински, известный в лаборатории искусственного интеллекта и Массачусетского технологического института, дает Джеральду Джею Сассману, студенту бакалавриата, летний проект по подключению компьютера к камере, чтобы компьютер «описывал то, что он видел». Таким образом, он начинает поиски решения проблемы «визуального ввода», которая тогда считалась более простой, чем проблема когнитивного интеллекта в машинах. Это продолжает сбивать с толку экспертов. Для..