В последние недели мы получили несколько удивительных новостей в области компьютерного зрения. В сериале YOLO (You Only Look Once) появился новый участник по имени MT-YOLOv6, которого также можно назвать YOLOv6.

Модели серии YOLO хорошо известны благодаря способности обнаруживать объекты в режиме реального времени, и все эти модели разрабатываются компанией Ultralystics. Обновление за обновлением мы видим, что они повышают скорость и точность процедуры. Разработка YOLOv6 велась в отделе визуальной разведки Meituan, и одна из интересных особенностей этой модели заключается в том, что она доступна всем как открытый исходный код. Технологическая команда Meituan представила свою модель как YOLOv6, потому что они черпали вдохновение в оригинальной серии YOLO. Давайте посмотрим на сравнение между новой и старой версиями YOLO.

Чем MT-YOLOv6 отличается от YOLOv5?

По данным исследовательской группы, YOLOv6 превзошел другие модели YOLO, такие как YOLOv5, с точки зрения точности и скорости прогнозирования. Они протестировали эту модель, используя набор данных COCO. Эта модель поддерживает различные платформы развертывания, что упрощает работу по развертыванию. Под изображениями представлено это сравнение (взято с GitHub).

Здесь выше с правой стороны мы видим график между процентом точности различных моделей, включая YOLOv6, и кадрами, обрабатываемыми в секунду при использовании набора данных COCO. Слева мы можем видеть точность моделей, когда они обрабатывают только одно изображение.

С точки зрения разработки, мы можем рассматривать эту модель как прямую градацию YOLOv5. Ниже приведены некоторые улучшения, которые выполнила команда:

  • Единообразный дизайн основы и шеи системы, чтобы они могли быть более эффективными.
  • Повышена эффективность разъединенной головы сети с помощью методов оптимизации.
  • Они использовали парадигму обучения без привязки, в то время как программа дополняется стратегией SimOTA маркировки данных и стратегией SloU применения ограничивающих рамок для повышения точности обнаружения.

Как обсуждалось ранее, эта модель имеет открытый исходный код, и, используя ссылку, мы можем получить доступ к кодам, в которых также доступны предварительно обученные веса для моделей нано, крошечных и малых размеров.

Рекомендации

  • Статья «YOLOv6: быстрая и точная система обнаружения целей с открытым исходным кодом», опубликованная технической командой Meituan 23 июня 2022 г.

О ДСВ

Data Science Wizards (DSW) — это стартап в области искусственного интеллекта и науки о данных, который в первую очередь предлагает платформы, решения и услуги для использования данных в качестве стратегии с помощью решений для ИИ и анализа данных, а также консультационных услуг, чтобы помочь предприятиям принимать решения, основанные на данных. .

Флагманская платформа DSW UnifyAI — это комплексная платформа с поддержкой ИИ, позволяющая корпоративным клиентам создавать, развертывать, управлять и публиковать свои модели ИИ. UnifyAI помогает вам создать бизнес-вариант использования, используя возможности ИИ и улучшая результаты аналитики.

Свяжитесь с нами по адресу [email protected] и посетите нас на www.datasciencewizards.ai

Спасибо за чтение!