Публикации по теме computer-vision

Публикации по теме 'computer-vision'

2020 год: экспансия трансформаторов в резюме

В предыдущие годы трансформеры очень хорошо проявили себя в области НЛП. Они значительно улучшили производительность моделей языковой обработки, и эффект сопоставим с тем, что было сделано для понимания изображений с 2012 года с помощью сверточных нейронных сетей. Теперь, в конце 2020 года, у нас есть трансформеры, входящие в верхний квартиль известных тестов компьютерного зрения, таких как классификация изображений в ImageNet и обнаружение объектов в COCO. Продолжая тему предыдущего..

Проблемы со спутниковыми изображениями SpaceNet 4 вне надира: угол обзора и азимутальный угол цели

Примечание. Задача SpaceNet заключается в ускорении геопространственного машинного обучения и поддерживается организациями-членами SpaceNet. Чтобы узнать больше, посетите https://spacenetchallenge.github.io/ . Этот пост является частью 3 серии о SpaceNet 4: Off-Nadir Dataset и Building Detection Challenge. Для первых двух частей серии нажмите здесь и здесь . Четвертый раунд конкурса SpaceNet: задание по обнаружению зданий за пределами Надира началось! В недавнем посте..

Потери восприятия при восстановлении глубокого изображения

От среднеквадратичной ошибки до GAN - что делает функцию потерь восприятия хорошей? Первым применением нейронных сетей, о котором я не мог удержаться от восклицания Вау! , Была плодотворная статья о переносе стилей . В работе использовались сверточные нейронные сети (CNN) для передачи стиля от одного изображения к другому. Впервые мы смогли добавить классные художественные фильтры к обычным картинкам - превратить любую фотографию в картину Ван Гоу или добавить мазки кисти Моне!..

Реконструкция: Могучая камера

В основе DroneDeploy лежит продукт под названием Map Engine , способный быстро и точно реконструировать 3D-сцены из коллекции фотографий без каких-либо предварительных сведений о том, где были сделаны фотографии или что они содержат. Это одна из основных проблем области фотограмметрии , которая широко использует методы компьютерного зрения и машинного обучения. Возможность сделать это очень важна, так как цифровая камера намного дешевле и ее легче перемещать, чем 3D-сканер, но вам нужно..

Анализ футбольных игр из видеопотока с помощью машинного обучения

Понимание сцены футбольных матчей из видеопотока с использованием машинного обучения и традиционных методов резюме. Футбол ( футбол в США) - один из самых популярных видов спорта во всем мире, и он способен привлечь внимание миллионов энтузиастов к одной игре в высших лигах: миллионы (x2) глаз Зациклен на тех же изображениях, на которых 22 игрока борются за владение мячом. Что ж, это еще не все, что нужно знать о просмотре футбольного матча, и если мы проанализируем объем данных,..

YOLO V1 (часть -1)

YOLO — это алгоритм «вы только посмотрите один раз», используемый для обнаружения объектов в реальном времени. В этой статье мы подробно обсудим YOLO. Он превзошел другие методы обнаружения, включая DPM, R-CNN и Fast-RCNN. DPM использует метод скользящего окна, а RCNN использует метод предложения региона, чтобы сначала сгенерировать x no. потенциальных ограничивающих рамок, а затем запустить классификатор в этих предложенных ограничивающих рамках. В то время как YOLO может предсказывать..

Изучение компьютерного зрения

В последнее время я много читал и экспериментировал с компьютерным зрением, вот введение того, что интересно узнать и использовать в этой области. Компьютерное зрение сильно продвинулось в последние годы. Вот те темы, которые я упомяну здесь: Технологии: Распознавание лиц: Haar, HOG, MTCNN, Mobilenet Распознавание лиц: CNN, Facenet Распознавание объектов: alexnet, inceptionnet, resnet Трансферное обучение: переобучение большой нейронной сети с небольшими ресурсами по новой теме..