Публикации по теме 'computer-vision'
Слои сверточной нейронной сети
Если мы хотим, чтобы машины думали, нам нужно научить их видеть.
- Фей Фей Ли, исследователь искусственного интеллекта в Стэнфордском университете.
В предыдущей главе этой серии мы представили простое введение в сверточную нейронную сеть (CNN), которая является основным строительным блоком большинства, если не всех алгоритмов компьютерного зрения. В этой главе мы познакомимся с жизненно важными слоями, которые составляют нашу повседневную CNN.
Сверточный слой
Наиболее..
Pixel2Style2Pixel: новая архитектура кодировщика улучшает преобразование изображения лица в изображение
В недавно опубликованной статье Кодирование в стиле: кодировщик StyleGAN для преобразования изображения в изображение исследователи из Penta-AI и Тель-Авивского университета представляют общую структуру преобразования изображения в изображение, получившую название Pixel2Style2Pixel ( pSp).
В отличие от предыдущих методов, в которых используются специализированные архитектуры для конкретных задач, предлагаемая структура предназначена для решения широкого круга задач преобразования..
Обнаружение ключевых точек лица с помощью пирадокса
Pyradox - это библиотека Python, которая помогает вам реализовать различные современные нейронные сети полностью настраиваемым образом с помощью TensorFlow 2.
Что такое ключевые моменты для лица?
Ключевые точки лица также называются лицевыми ориентирами, которые используются для локализации и представления выступающих областей лица, таких как: глаза, брови, нос, рот, линия подбородка и т. Д. Ориентиры лица были успешно применены для выравнивания лица, оценки положения головы. , смена..
Введение в угловой детектор Харриса
Детектор углов Harris - это оператор обнаружения углов, который обычно используется в алгоритмах компьютерного зрения для извлечения углов и определения особенностей изображения. Впервые он был представлен Крисом Харрисом и Майком Стивенсом в 1988 году после усовершенствования углового детектора Моравека. По сравнению с предыдущим, детектор углов Харриса учитывает разницу угловых оценок напрямую по отношению к направлению, вместо использования смещаемых участков для каждых 45-градусных..
Патчи - все, что вам нужно?
Архитектуры преобразователей изображений (ViT) достигли непревзойденной производительности при решении многих задач компьютерного зрения, часто превосходя классические сверточные архитектуры. Возникает вопрос: является ли впечатляющая производительность ViT результатом их мощной трансформаторной архитектуры и механизмов внимания, или есть какой-то другой фактор, который дает ViT преимущество?
В статье Патчи - это все, что вам нужно , которая в настоящее время проходит двойную слепую..
В чем разница между обнаружением объектов и сегментацией изображений?
А когда какой использовать?
Обработка изображений в искусственном интеллекте
Искусственный интеллект выполняет разные задачи для обработки изображений. В этой статье я расскажу о различиях между обнаружением объектов и сегментацией изображений.
В обеих задачах мы хотим найти на изображении расположение определенных элементов, представляющих интерес. Например, у нас может быть набор изображений с камеры наблюдения, и на каждом изображении мы хотим идентифицировать местоположения..
Компьютерное зрение: от проекта летнего стажера к новому определению будущего ИИ
Приблизительно 1966: Марвин Мински, известный в лаборатории искусственного интеллекта и Массачусетского технологического института, дает Джеральду Джею Сассману, студенту бакалавриата, летний проект по подключению компьютера к камере, чтобы компьютер «описывал то, что он видел». Таким образом, он начинает поиски решения проблемы «визуального ввода», которая тогда считалась более простой, чем проблема когнитивного интеллекта в машинах. Это продолжает сбивать с толку экспертов.
Для..