YOLO - это система распознавания объектов в реальном времени, которая может распознавать несколько объектов в одном кадре - и она стала еще лучше!

Что такое ЙОЛО?

YOLO - это сокращение от You Only Look Once. Это система распознавания объектов в реальном времени, которая может распознавать несколько объектов в одном кадре. YOLO распознает объекты точнее и быстрее, чем другие системы распознавания. Он может предсказывать до 9000 классов и даже невидимые классы. Система распознавания в реальном времени распознает несколько объектов на изображении, а также создаст рамку вокруг объекта. Его можно легко обучить и развернуть в производственной системе.

Вот несколько ссылок, которые могут вас заинтересовать:

- Complete your Python analyses 10x faster with Mito [Product]
- Free skill tests for Data Scientists & ML Engineers [Test]
- All New Self-Driving Car Engineer Nanodegree [Course]

Хотели бы вы прочитать больше таких статей? Если да, вы можете поддержать меня, нажав на любую ссылку выше. Некоторые из них являются партнерскими ссылками, но вам не нужно ничего покупать.

Как работает YOLO?

YOLO основан на единой сверточной нейронной сети (CNN). CNN делит изображение на области, а затем предсказывает граничные рамки и вероятности для каждой области. Он одновременно прогнозирует несколько ограничивающих рамок и вероятностей для этих классов. YOLO видит все изображение во время обучения и тестирования, поэтому неявно кодирует контекстную информацию о классах, а также об их внешнем виде.

Кто разработал YOLO?

YOLO разработан Джозеф Редмон. Внедрение системы распознавания объектов в реальном времени YOLO в 2016 году является краеугольным камнем исследований в области распознавания объектов. Это привело к созданию более совершенных и быстрых алгоритмов компьютерного зрения.

Кто разработал YOLOv4?

YOLO v4 разработан тремя разработчиками Алексеем Бочковским, Чиен-Яо Ван и Хун-Юань Марком Ляо.

Почему Джозеф Редмон не разрабатывает YOLOv4?

Он бросил разработку YOLO v4 из-за возможного неправильного использования его технологий. Особо он имел в виду «военные приложения и вопросы защиты данных». Он прекращает свои исследования в области компьютерного зрения, потому что обнаружил, что связанные с этим этические вопросы «невозможно игнорировать».

Что нового в YOLOv4?

Архитектура YOLOv4 состоит из CSPDarknet53 в качестве основы, дополнительного модуля объединения пространственных пирамид, шейки агрегации путей PANet и головки YOLOv3.

CSPDarknet53 - это новая основа, которая может расширить возможности обучения CNN. Блок объединение пространственных пирамид добавлен поверх CSPDarknet53 для увеличения восприимчивого поля и выделения наиболее важных функций контекста. Вместо сетей пирамиды функций (FPN) для обнаружения объектов, используемых в YOLOv3, PANet используется в качестве метода агрегирования параметров для различных уровней детекторов.

Что такое улучшение результатов?

YOLOv4 в два раза быстрее EfficientDet (модель конкурентного распознавания) с сопоставимой производительностью. Кроме того, AP (средняя точность) и FPS (количество кадров в секунду) увеличились на 10% и 12% по сравнению с YOLOv3.

Заключение

YOLO - это футуристический распознаватель, который имеет более быстрый FPS и более точный, чем существующие детекторы. Детектор можно обучить и использовать на обычном графическом процессоре, что обеспечивает широкое распространение. Новые функции YOLOv4 повышают точность классификатора и детектора и могут быть использованы для других исследовательских проектов.

использованная литература

Прежде чем ты уйдешь

Следуйте за мной в Twitter, где я регулярно пишу твиты о Data Science и машинном обучении.