Лучшие открытые и бесплатные репозитории/библиотеки Python для обнаружения пользовательских объектов

Обнаружение объектов — это компьютерная технология, связанная с компьютерным зрением и обработкой изображений, которая обнаруживает экземпляры семантических объектов определенного класса в цифровых изображениях и видео.

В сегодняшней статье мы поговорим о шести пользовательских проектах по обнаружению объектов с открытым исходным кодом, которые помогут улучшить ваши навыки в области компьютерного зрения и обработки изображений.

Примечание. В этой статье мы поговорим о некоторых не очень известных, но действительно хороших проектах обнаружения пользовательских объектов с открытым исходным кодом, которые вы можете использовать в своих проектах. Чтобы узнать больше о каждом из них, я рекомендую перейти по ссылке, указанной вдоль проекта.

Бонус

Отличное обнаружение объектов. Это список замечательных статей об обнаружении объектов.

Репозиторий Github

Документация

Обучение — это не только повышение компетентности в своей работе. Это гораздо больше. Datacamp позволяет мне учиться без ограничений.

Datacampпредоставляет вам гибкость, необходимую для прохождения курсов в свободное время и изучения основных навыков, необходимых для перехода к успешной карьере.

Datacamp научил меня быстро улавливать новые идеи и применять их к реальным проблемам. Пока я был на этапе обучения, Datacamp зацепил меня всем, что происходит на курсах, от содержания курсов и отзывов ассистентов до встреч и твитов профессора.

Вот некоторые из моих любимых курсов, которые я настоятельно рекомендую вам изучать, когда это соответствует вашему графику и настроению. Вы можете напрямую применить концепции и навыки, полученные на этих курсах, в новом увлекательном проекте на работе или в университете.

Возвращаясь к теме —

1. Ммобнаружение

Гитхаб

Официальная документация

"Бумага"

MMDetection — это инструментарий для обнаружения объектов с открытым исходным кодомна основе PyTorch. Это часть проекта OpenMMLab. Вы также можете использовать его для вывода, тестирования и обучения предопределенных моделей с помощью настраиваемых наборов данных. Обучение для индивидуализированного набора данныхописывается тремя шагами ниже:

Подготовьте настроенный набор данных
Подготовить конфигурацию
Обучайте, тестируйте и выводите модели на основе настроенного набора данных.

Основные особенности

Модульная конструкция

Мы разбиваем инфраструктуру обнаружения на разные компоненты, и можно легко создать индивидуальную инфраструктуру обнаружения объектов, комбинируя другие модули.

Поддержка нескольких фреймворков из коробки

Набор инструментов напрямую поддерживает популярные и современные платформы обнаружения, например. Быстрее RCNN, Mask RCNN, RetinaNet и т. д.

Высокая эффективность

Все основные операции с блоками и масками выполняются на графических процессорах. Скорость обучения выше или сравнима с другими кодовыми базами, включая Detectron2, maskrcnn-benchmark и SimpleDet.

Уровень развития

Набор инструментов основан на кодовой базе, разработанной командой MMDet, которая выиграла конкурс COCO Detection Challenge в 2018 году, и мы продолжаем развивать его.

2. Темный поток

Гитхаб

Статья: версия 1, версия 2.

Darkflow — это переведенная версия даркнета в TensorFlow. Загрузка обученных весов, переобучение/точная настройка с помощью TensorFlow, регулярный экспорт определений графиков на мобильные устройства. В основном он используется для обнаружения объектов в реальном времени и классификации.

Он реализован в Python3, Tensorflow 1.0, NumPy, OpenCV 3.

Это может помочь вам с:

Анализ аннотаций
Дизайн сети
Поток графа с помощью потока
Обучение новой модели
Обучение набору данных
Демонстрация камеры/видеофайла
Использование darkflow из другого приложения Python
Сохраните построенную диаграмму в файл protobuf (.pb)

3. ИмиджИИ

Гитхаб

Официальная документация

Страница ImageAI

ImageAI – это современный ИИ для распознавания и обнаружения с несколькими строками кода. Моисей Олафенва и Джон Олафенва.

ImageAI – это простая в использовании библиотека Computer Vision Python, которая позволяет разработчикам легко интегрировать самые современные искусственные Анализ функций в существующих приложениях и системах.

Построенный с учетом простоты, ImageAI поддерживает список современных алгоритмов машинного обучения для прогнозирования изображения, прогнозирования пользовательского изображения, обнаружения объектов, отслеживания видеообъектов и обучения прогнозированию изображений.

ImageAI в настоящее время поддерживает прогнозирование изображений и обучение с использованием четырех различные алгоритмы машинного обучения, обученные на наборе данных ImageNet-1000. ImageAI также поддерживает обнаружение объектов, обнаружение видео и отслеживание объектовс использованием RetinaNet, YOLOv3и TinyYOLOv3 обучен набору данных COCO. Наконец, ImageAI позволяет подготовить пользовательские модели для обнаруженияи распознавание новых объектов.

Со временем ImageAI обеспечит поддержку более широких и специализированных аспектов Computer Vision, включая распознавание изображений в уникальных средах и специальных полях.

4. ГлюонCV

Гитхаб

Официальная документация

GluonCV предоставляет реализации самых современных (SOTA) моделей глубокого обучения вкомпьютерном зрении.

Этот инструментарий предлагает четыре основные функции:

Обучение скриптов воспроизведению результатов SOTA, описанных в научных статьях
Поддерживает PyTorch и MXNet
Большое количество предварительно обученных моделей
Мощный, легкий, гибкий и удобный для развертывания репозиторий
Тщательно разработанные API, которые значительно упрощают реализацию

Он поддерживает различные приложения, включая:

Классификация изображений
Обнаружение объектов
Семантическая сегментация
Сегментация экземпляров
Оценка позы
Распознавание действий

5. АделаиДет

Гитхаб

AdelaiDetявляется открытым исходным кодом набором инструментов для обнаружения нескольких экземпляров и задачи распознаванияповерх Detectron2.

На сегодняшний день в AdelaiDet реализованы следующие алгоритмы:

FCOS
BlendMask
MEInst
ABCNet
CondInst
СОЛО (версия mmdet)
СОЛОв2
Будет выпущен BoxInst (демонстрационное видео)
DirectPose будет выпущен

Модели, реализованные в AdelaiDet, включают:

Базовые показатели обнаружения объектов COCO с помощью FCOS
Базовые показатели сегментации экземпляров COCO с помощью BlendMask
Базовые показатели сегментации экземпляров COCO с помощью MEInst
Результаты Total_Text с ABCNet
Базовые показатели сегментации экземпляров COCO с помощью CondInst

6. YOLOv3_TensorFlow

Гитхаб

Внедрение TensorFlow YOLO v3 с поддержкой обучения на вашем наборе данных.

Он содержит полный процесс обучения и оценки вашего собственного набора данных. Ключевые особенности этого репозитория:

Эффективный тф. конвейер данных
Преобразователь весов (преобразование предварительно обученных весов даркнета в наборе данных COCO в контрольную точку TensorFlow.)
Чрезвычайно быстрое немаксимальное подавление графического процессора.
Полный процесс обучения и оценки.
Алгоритм Kmeans для выбора предыдущих блоков привязки.

Если вам понравилось читать эту статью, я уверен, что мы разделяем схожие интересы и работаем/будем работать в схожих отраслях. Итак, подключаемся через LinkedIn и Github. Пожалуйста, не стесняйтесь отправить запрос на контакт!

Лучшие открытые и бесплатные репозитории/библиотеки Python для обнаружения пользовательских объектов

1. Ммобнаружение

Модульная конструкция

Поддержка нескольких фреймворков из коробки

Высокая эффективность

Уровень развития

2. Темный поток

3. ИмиджИИ

4. ГлюонCV

5. АделаиДет

6. YOLOv3_TensorFlow

Вопросы по теме