Начало работы с YOLO



  1. Edge YOLO: интеллектуальная система обнаружения объектов в режиме реального времени на основе взаимодействия Edge-Cloud в автономных транспортных средствах(arXiv)

Автор:Сиюань Лян, Хао Ву

Аннотация . В связи с постоянно растущими требованиями к автономным транспортным средствам, таким как мониторинг трафика и помощник по вождению, обнаружение объектов на основе глубокого обучения (DL-OD) становится все более привлекательным в интеллектуальных транспортных системах. Однако существующим схемам DL-OD трудно реализовать ответственные, экономичные и энергоэффективные системы автономных транспортных средств из-за малого количества присущих им недостатков низкой своевременности и высокого энергопотребления. В этой статье мы предлагаем систему обнаружения объектов (OD), основанную на сотрудничестве граничных облаков и реконструктивных сверточных нейронных сетях, которая называется Edge YOLO. Эта система позволяет эффективно избежать чрезмерной зависимости от вычислительной мощности и неравномерного распределения ресурсов облачных вычислений. В частности, это облегченная структура OD, реализованная путем объединения сети извлечения признаков обрезки и сети слияния признаков сжатия, чтобы максимально повысить эффективность многомасштабного прогнозирования. Кроме того, мы разработали платформу для автономного вождения, оснащенную NVIDIA Jetson для проверки на системном уровне. Мы экспериментально демонстрируем надежность и эффективность Edge YOLO на наборах данных COCO2017 и KITTI соответственно. Согласно стандартным наборам данных COCO2017 со скоростью 26,6 кадров в секунду (FPS), результаты показывают, что количество параметров во всей сети составляет всего 25,67 МБ, а точность (mAP) — до 47,3%.

2. YOLO-Pose: улучшение YOLO для оценки позы нескольких человек с использованием потери подобия ключевых точек объекта(arXiv)

Автор:: Дебаприя Маджи, Соеб Нагори, Ману Мэтью, Дипак Поддар

Аннотация: мы представляем YOLO-pose, новый подход без использования тепловых карт для совместного обнаружения и двухмерной оценки позы нескольких человек на изображении на основе популярной системы обнаружения объектов YOLO. Существующие двухэтапные подходы на основе тепловых карт являются неоптимальными, поскольку они не поддаются сквозному обучению, а обучение основано на суррогатной потере L1, которая не эквивалентна максимизации оценочной метрики, то есть сходства ключевых точек объекта (OKS). Наша структура позволяет нам обучать модель от начала до конца и оптимизировать саму метрику OKS. Предлагаемая модель учится совместно обнаруживать ограничивающие рамки для нескольких людей и их соответствующие 2D-позы за один прямой проход и, таким образом, использовать лучшие подходы как сверху вниз, так и снизу вверх. Предлагаемый подход не требует постобработки подходов снизу вверх для группировки обнаруженных ключевых точек в скелет, поскольку каждая ограничивающая рамка имеет связанную позу, что приводит к присущей группировке ключевых точек. В отличие от подходов сверху вниз, от множественных проходов вперед покончено, поскольку все люди локализованы вместе с их позой в одном выводе. YOLO-pose достигает новых современных результатов по проверке COCO (90,2% AP50) и набору тестовых разработок (90,3% AP50), превосходя все существующие подходы снизу вверх за один проход вперед без флип-теста, мульти- тестирование масштаба или любое другое увеличение времени тестирования. Все эксперименты и результаты, представленные в этой статье, не требуют увеличения времени тестирования, в отличие от традиционных подходов, в которых для повышения производительности используются флип-тесты и многомасштабные тесты. Наши учебные коды будут общедоступны на https://github.com/TexasInstruments/edgeai-yolov5 и https://github.com/TexasInstruments/edgeai-yolox.

3. PP-YOLOE: улучшенная версия YOLO(arXiv)

Автор:Шанлян Сюй, Синьсинь Ван, Вэньюй Лв, Циняо Чанг, Чэн Цуй, Кайпэн Дэн, Гуаньчжун Ван, Цинцин Дан, Шэнъюй Вэй, Юнин Ду, Баохуа Лай.

Аннотация: В этом отчете мы представляем PP-YOLOE, современный промышленный детектор объектов с высокой производительностью и удобным развертыванием. Мы оптимизируем на основе предыдущего PP-YOLOv2, используя парадигму без привязки, более мощный костяк и гриф, оснащенный CSPRepResStage, ET-head и динамическим алгоритмом назначения меток TAL. Мы предлагаем модели s/m/l/x для различных практических сценариев. В результате PP-YOLOE-l достигает 51,4 мАч на COCO test-dev и 78,1 FPS на Tesla V100, что дает значительное улучшение (+1,9 АР, +13,35% ускорение) и (+1,3 АР, +24,96% скорость). вверх) по сравнению с предыдущими современными промышленными моделями PP-YOLOv2 и YOLOX соответственно. Кроме того, скорость вывода PP-YOLOE достигает 149,2 кадра в секунду с TensorRT и точностью FP16. Мы также проводим обширные эксперименты, чтобы проверить эффективность наших разработок. Исходный код и предварительно обученные модели доступны по адресу https://github.com/PaddlePaddle/PaddleDetection.