Начало работы с YOLO



  1. Система обнаружения объектов в реальном времени с моделями YOLO и CNN: обзор(arXiv)

Автор: Вишванатха В., Чандана Р. К., Рамачандра А. С.

Вывод: Область искусственного интеллекта основана на методах обнаружения объектов. Алгоритм YOU ONLY LOOK ONCE (YOLO) и его более развитые версии кратко описаны в этом исследовательском обзоре. В этом обзоре рассказывается о YOLO и сверточных нейронных сетях (CNN) в направлении обнаружения объектов в реальном времени. YOLO делает обобщенное представление объектов более эффективно без потерь точности, чем другие модели обнаружения объектов. Архитектурные модели CNN имеют возможность устранять блики и идентифицировать объекты. в любом заданном изображении. При правильном внедрении модели CNN могут решать такие задачи, как диагностика деформации, создание образовательных или обучающих приложений и т. д. Эта статья содержит множество наблюдений и перспективных выводов посредством анализа. других отраслях, освещает метод обнаружения целей и выбора признаков, а также кратко описывает процесс разработки алгоритма YOLO.

2.LPYOLO: YOLO низкой точности для распознавания лиц на FPGA(arXiv)

Автор: Бестами Гюнай, Сефа Бурак Окчу, Хасан Шакир Бильге

Аннотация. В последние годы количество периферийных вычислительных устройств и приложений искусственного интеллекта на них значительно увеличилось. В граничных вычислениях процессы принятия решений и вычисления переносятся с серверов на граничные устройства. Следовательно, требуются дешевые и маломощные устройства. FPGA имеют очень малое энергопотребление, склонны выполнять параллельные операции и хорошо подходят для запуска сверточных нейронных сетей (CNN), которые являются фундаментальной единицей приложения искусственного интеллекта. Обнаружение лиц в системах наблюдения — наиболее ожидаемое приложение на рынке безопасности. В этой работе архитектура TinyYolov3 переработана и развернута для распознавания лиц. Это метод обнаружения объектов на основе CNN, разработанный для встроенных систем. PYNQ-Z2 выбран в качестве целевой платы, на которой установлена ​​недорогая система Xilinx Zynq 7020 System-on-Chip (SoC). Модернизированная модель TinyYolov3 определяется в многочисленных разрядах точности с библиотекой Brevitas, которая предоставляет основные слои CNN и активации в форме целочисленного квантования. Затем модель обучается в квантованной структуре с набором данных WiderFace. Чтобы уменьшить задержку и энергопотребление, встроенная память FPGA настроена как хранилище всех параметров сети, а последняя функция активации изменена как масштабированная HardTanh вместо Sigmoid. Также к логическим ресурсам ПЛИС применяется высокая степень параллелизма. Модель преобразуется в приложение на основе HLS с использованием фреймворка FINN и библиотеки FINN-HLS, которая включает определения слоев на C++. Позже модель синтезируется и развертывается. ЦП SoC использует механизм многопоточности и отвечает за предварительную обработку, постобработку и потоковые операции TCP/IP. Следовательно, общее энергопотребление платы 2,4 Вт, пропускная способность 18 кадров в секунду (FPS) и показатель точности 0,757 mAP в категории Easy WiderFace достигаются с помощью модели с 4-битной точностью.

3. CF-YOLO: Cross Fusion YOLO для обнаружения объектов в неблагоприятных погодных условиях с использованием высококачественного набора данных о реальном снеге(arXiv)

Автор: Цици Дин, Пэн Ли, Сюэфэн Янь, Дин Ши, Луминг Лян, Вэймин Ван, Хаоран Се, Джонатан Ли, Минцян Вэй

Вывод: Снег является одним из самых сложных погодных условий для обнаружения объектов (OD). В настоящее время не только не хватает наборов данных о снежной оптической плотности для обучения передовых детекторов, но и эти детекторы испытывают трудности с изучением скрытой информации, полезной для обнаружения на снегу. Чтобы решить две вышеупомянутые проблемы, мы сначала создадим набор данных OD для снежного покрова реального мира, названный RSOD. Кроме того, мы разрабатываем неконтролируемую тренировочную стратегию с характерной функцией активации, которая называется Peak Act, для количественной оценки воздействия снега на каждый объект. Peak Act помогает классифицировать изображения в RSOD по четырем уровням сложности. Насколько нам известно, RSOD является первым количественно оцененным и классифицированным набором данных ОП снежного покрова. Затем мы предлагаем новый блок Cross Fusion (CF) для создания облегченной сети OD на основе YOLOv5 (назовите CF-YOLO). CF — это подключаемый модуль агрегации функций, который объединяет преимущества сети Feature Pyramid Network и сети агрегации путей в более простой, но более гибкой форме. Как RSOD, так и CF приводят к тому, что наш CF-YOLO обладает способностью оптимизации для OD в условиях реального снега. То есть CF-YOLO может справиться с неблагоприятными проблемами обнаружения расплывчатости, искажения и покрытия снегом. Эксперименты показывают, что наш CF-YOLO обеспечивает лучшие результаты обнаружения на RSOD по сравнению с SOTA. Код и набор данных доступны по адресу https://github.com/qqding77/CF-YOLO-and-RSOD.