Публикации по теме 'computer-vision'


Привет, мир компьютерного зрения: рукописная классификация цифр MNIST
В этой истории мы рассмотрим легендарный набор данных MNIST. Этот набор данных довольно популярен среди новичков в машинном обучении. Фактически, этот набор данных настолько популярен, что его часто называют «Привет, мир» машинного обучения или компьютерного зрения. Этот рассказ также даст представление о проблемах классификации в машинном обучении. В конце концов, вы сможете ответить на некоторые частые вопросы о том, как решать мультиклассовую классификацию? какие показатели..

Варианты SSD - понимание деконволюционных детекторов одиночного импульса
Введение в SSD Single-shot MultiBox Detector - это одноэтапный алгоритм обнаружения объектов. Это означает, что, в отличие от двухэтапных моделей, твердотельные накопители не нуждаются в этапе генерации первоначальных предложений объекта. Это, как правило, делает его более быстрым и эффективным, чем двухэтапные подходы, такие как Faster R-CNN, хотя он жертвует производительностью при обнаружении небольших объектов для увеличения скорости. В исходной статье для SSD авторы предложили..

Высокоскоростной конвейер компьютерного зрения для универсальной сортировочной машины LEGO
Высокоскоростной конвейер компьютерного зрения для универсальной сортировочной машины LEGO Последние несколько лет я конструировал и конструировал машину, которая может распознавать и сортировать кубики LEGO. Ключевой частью машины является Блок захвата - это небольшая закрытая камера, в которой есть ремень, свет и камера. Камера делает снимки деталей LEGO, движущихся по ленте, а затем отправляет изображения деталей по беспроводной сети на сервер, который запускает алгоритм..

Компьютеры тоже могут видеть
Одной из самых влиятельных технологий, изменивших ход истории в прошлом столетии, была технология камеры: это было началом того, что наши машины начали видеть. Фотография позволила нам запечатлеть лучшие и худшие моменты в истории, что дало возможность осознавать, размышлять и действовать. Сила и влияние фотографии только усилились с появлением телефонов с камерами в начале 2000-х. Внезапно миллионы людей получили возможность задокументировать все, от ужасов жизни при диктаторах до..

Многокомандный метод обнаружения объектов футбольных игр на raspberry pi3
Создание 1 модели обнаружения объектов для обнаружения 4 разных футбольных команд. Введение Компьютерное зрение - это ветвь глубокого обучения, которая фокусируется на использовании глубоких нейронных сетей для моделирования проблем по изображениям. В этой статье мы рассмотрим, как применить компьютерное зрение в качестве инструмента футбольной аналитики. Футбол - это вид спорта, в котором участвуют 2 команды; в каждой команде по 11 игроков и вратарь. Вот некоторые аналитические..

Марковская модель для понимания контекста изображения
Объект: моделирование вероятностного распределения контекста изображения, например. в наборе данных PASCAL VOC2012. Предварительная обработка данных Задача Pascal VOC — это очень популярный набор данных для построения и оценки алгоритмов классификации изображений, обнаружения объектов и сегментации. Сегментация изображения — это разреженная классификация каждого пикселя в изображении, в то время как классификация изображений обычно использует один объект в качестве фокуса и сообщает..

Распознавание жестов рук
Наука о данных в R Распознавание жестов рук Построение модели нейронной сети для понимания языка жестов и способов его улучшения Американский язык жестов (ASL) - это законченный естественный язык, который имеет те же лингвистические свойства, что и разговорные языки, с грамматикой, отличной от английского. ASL выражается движениями рук и лица. Это основной язык многих глухих и слабослышащих североамериканцев, но он также используется многими слышащими людьми. Нам даны..