Публикации по теме 'computer-vision'


Самоуправляемые автомобили - Расширенный проект поиска полосы движения
- сдано после 3 подачи Автор: Хао Чжуан, 2018 г. Цели / шаги этого проекта следующие: Вычислите калибровочную матрицу камеры и коэффициенты искажения для набора изображений шахматной доски. Примените коррекцию искажения к необработанным изображениям. Используйте преобразования цвета, градиенты и т. Д., Чтобы создать двоичное изображение с пороговыми значениями. Примените перспективное преобразование, чтобы исправить двоичное изображение («вид с высоты птичьего полета»). Обнаружение..

Архитектуры решений для проектов компьютерного зрения
Заметка о различных инженерных архитектурах, доступных для развертывания решения компьютерного зрения. Недавно мой коллега обсуждал со мной различные архитектуры, которые он может использовать для развертывания решения Computer Vision. Мы сели и составили список, которым я подумал, что было бы неплохо поделиться здесь. Пожалуйста, поделитесь своими мыслями. Мы говорили о наилучшем способе развертывания решения Computer Vision на основе глубокого обучения. Для этого нужно было..

Демистификация транспонированной свертки
Транспонированные свертки - это революционная концепция для таких приложений, как сегментация изображений, сверхвысокое разрешение и т. Д., Но иногда ее становится немного сложнее понять. В этом посте я попытаюсь демистифицировать концепцию и упростить ее понимание. Вступление Computer Vision Domain переживает переходную фазу с момента завоевания популярности сверточных нейронных сетей (CNN). Революция началась с того, что Alexnet выиграл конкурс ImageNet в 2012 году, и с тех пор..

Понимание компьютерного зрения и обработки изображений 2020 | Вебтуникс
Обработка изображений является подмножеством компьютерного зрения. Это алгоритм, который пытается эмулировать зрение в человеческом масштабе. Компьютерное зрение — это ветвь искусственного интеллекта (ИИ), которая обучает компьютеры интерпретировать и понимать визуальный мир.

Улучшение газетных фотографий и декодирование зашумленных номерных знаков с помощью частотных фильтров и пространственных…
Путешествие в область восстановления изображений и оптического дешифрования для получения более четких газетных изображений и разборчивых номерных знаков Какова основная цель этой задачи или проекта у нас есть зашумленное изображение автомобиля с нечитаемым номерным знаком, и мы хотим улучшить видимость номерного знака с помощью методов обработки изображений. Обработка изображений включает в себя манипулирование цифровыми изображениями для улучшения их качества, извлечения полезной..

Документы с объяснением 21: Функциональная пирамидальная сеть
Пирамиды признаков являются основным компонентом систем распознавания для обнаружения объектов в разных масштабах. Но недавние детекторы объектов глубокого обучения избегали пирамидальных представлений, отчасти потому, что они требуют больших вычислительных ресурсов и памяти. Сеть функциональных пирамид использует внутреннюю многомасштабную пирамидальную иерархию глубоких сверточных сетей для построения пирамиды функций с минимальными дополнительными затратами. Архитектура сверху вниз..

Точность-отзыв
Аналогия с рестораном Эта статья является началом серии статей, в которых рассказывается о проблемах, решения которых предлагает NuronLabs. Precision-Recall — это важная метрика, которая измеряет производительность в нескольких сложных задачах визуального восприятия, таких как обнаружение объектов и сегментация экземпляров/семантическая сегментация. Модели, обученные решать эти задачи, часто чувствительны и ведут себя по-разному на разных визуальных распределениях. Таким образом,..