Обнаружение объектов — это компьютерная технология, связанная с компьютерным зрением и обработкой изображений, которая обнаруживает экземпляры семантических объектов определенного класса в цифровых изображениях и видео.
В сегодняшней статье мы поговорим о шести пользовательских проектах по обнаружению объектов с открытым исходным кодом, которые помогут улучшить ваши навыки в области компьютерного зрения и обработки изображений.
Примечание. В этой статье мы поговорим о некоторых не очень известных, но действительно хороших проектах обнаружения пользовательских объектов с открытым исходным кодом, которые вы можете использовать в своих проектах. Чтобы узнать больше о каждом из них, я рекомендую перейти по ссылке, указанной вдоль проекта.
Бонус
Отличное обнаружение объектов. Это список замечательных статей об обнаружении объектов.
Обучение — это не только повышение компетентности в своей работе. Это гораздо больше. Datacamp позволяет мне учиться без ограничений.
Datacampпредоставляет вам гибкость, необходимую для прохождения курсов в свободное время и изучения основных навыков, необходимых для перехода к успешной карьере.
Datacamp научил меня быстро улавливать новые идеи и применять их к реальным проблемам. Пока я был на этапе обучения, Datacamp зацепил меня всем, что происходит на курсах, от содержания курсов и отзывов ассистентов до встреч и твитов профессора.
Вот некоторые из моих любимых курсов, которые я настоятельно рекомендую вам изучать, когда это соответствует вашему графику и настроению. Вы можете напрямую применить концепции и навыки, полученные на этих курсах, в новом увлекательном проекте на работе или в университете.
- Data-scientist-with-python
- Data-scientist-with-r
- Ученый-машинное обучение-с-r
- Ученый-машинное обучение-с-питоном
- Машинное обучение для всех
- Наука о данных для всех
- Data-engineer-with-python
- Дата-аналитик-с-питоном
- Основы больших данных через pyspark
Возвращаясь к теме —
1. Ммобнаружение
"Бумага"
MMDetection — это инструментарий для обнаружения объектов с открытым исходным кодомна основе PyTorch. Это часть проекта OpenMMLab. Вы также можете использовать его для вывода, тестирования и обучения предопределенных моделей с помощью настраиваемых наборов данных. Обучение для индивидуализированного набора данныхописывается тремя шагами ниже:
- Подготовьте настроенный набор данных
- Подготовить конфигурацию
- Обучайте, тестируйте и выводите модели на основе настроенного набора данных.
Основные особенности
Модульная конструкция
- Мы разбиваем инфраструктуру обнаружения на разные компоненты, и можно легко создать индивидуальную инфраструктуру обнаружения объектов, комбинируя другие модули.
Поддержка нескольких фреймворков из коробки
- Набор инструментов напрямую поддерживает популярные и современные платформы обнаружения, например. Быстрее RCNN, Mask RCNN, RetinaNet и т. д.
Высокая эффективность
- Все основные операции с блоками и масками выполняются на графических процессорах. Скорость обучения выше или сравнима с другими кодовыми базами, включая Detectron2, maskrcnn-benchmark и SimpleDet.
Уровень развития
- Набор инструментов основан на кодовой базе, разработанной командой MMDet, которая выиграла конкурс COCO Detection Challenge в 2018 году, и мы продолжаем развивать его.
2. Темный поток
Darkflow — это переведенная версия даркнета в TensorFlow. Загрузка обученных весов, переобучение/точная настройка с помощью TensorFlow, регулярный экспорт определений графиков на мобильные устройства. В основном он используется для обнаружения объектов в реальном времени и классификации.
Он реализован в Python3, Tensorflow 1.0, NumPy, OpenCV 3.
Это может помочь вам с:
- Анализ аннотаций
- Дизайн сети
- Поток графа с помощью потока
- Обучение новой модели
- Обучение набору данных
- Демонстрация камеры/видеофайла
- Использование darkflow из другого приложения Python
- Сохраните построенную диаграмму в файл protobuf (.pb)
3. ИмиджИИ
ImageAI – это современный ИИ для распознавания и обнаружения с несколькими строками кода. Моисей Олафенва и Джон Олафенва.
ImageAI – это простая в использовании библиотека Computer Vision Python, которая позволяет разработчикам легко интегрировать самые современные искусственные Анализ функций в существующих приложениях и системах.
Построенный с учетом простоты, ImageAI поддерживает список современных алгоритмов машинного обучения для прогнозирования изображения, прогнозирования пользовательского изображения, обнаружения объектов, отслеживания видеообъектов и обучения прогнозированию изображений.
ImageAI в настоящее время поддерживает прогнозирование изображений и обучение с использованием четырех различные алгоритмы машинного обучения, обученные на наборе данных ImageNet-1000. ImageAI также поддерживает обнаружение объектов, обнаружение видео и отслеживание объектовс использованием RetinaNet, YOLOv3и TinyYOLOv3 обучен набору данных COCO. Наконец, ImageAI позволяет подготовить пользовательские модели для обнаруженияи распознавание новых объектов.
Со временем ImageAI обеспечит поддержку более широких и специализированных аспектов Computer Vision, включая распознавание изображений в уникальных средах и специальных полях.
4. ГлюонCV
GluonCV предоставляет реализации самых современных (SOTA) моделей глубокого обучения вкомпьютерном зрении.
Этот инструментарий предлагает четыре основные функции:
- Обучение скриптов воспроизведению результатов SOTA, описанных в научных статьях
- Поддерживает PyTorch и MXNet
- Большое количество предварительно обученных моделей
- Мощный, легкий, гибкий и удобный для развертывания репозиторий
- Тщательно разработанные API, которые значительно упрощают реализацию
Он поддерживает различные приложения, включая:
- Классификация изображений
- Обнаружение объектов
- Семантическая сегментация
- Сегментация экземпляров
- Оценка позы
- Распознавание действий
5. АделаиДет
AdelaiDetявляется открытым исходным кодом набором инструментов для обнаружения нескольких экземпляров и задачи распознаванияповерх Detectron2.
На сегодняшний день в AdelaiDet реализованы следующие алгоритмы:
- FCOS
- BlendMask
- MEInst
- ABCNet
- CondInst
- СОЛО (версия mmdet)
- СОЛОв2
- Будет выпущен BoxInst (демонстрационное видео)
- DirectPose будет выпущен
Модели, реализованные в AdelaiDet, включают:
- Базовые показатели обнаружения объектов COCO с помощью FCOS
- Базовые показатели сегментации экземпляров COCO с помощью BlendMask
- Базовые показатели сегментации экземпляров COCO с помощью MEInst
- Результаты Total_Text с ABCNet
- Базовые показатели сегментации экземпляров COCO с помощью CondInst
6. YOLOv3_TensorFlow
Внедрение TensorFlow YOLO v3 с поддержкой обучения на вашем наборе данных.
Он содержит полный процесс обучения и оценки вашего собственного набора данных. Ключевые особенности этого репозитория:
- Эффективный тф. конвейер данных
- Преобразователь весов (преобразование предварительно обученных весов даркнета в наборе данных COCO в контрольную точку TensorFlow.)
- Чрезвычайно быстрое немаксимальное подавление графического процессора.
- Полный процесс обучения и оценки.
- Алгоритм Kmeans для выбора предыдущих блоков привязки.
Если вам понравилось читать эту статью, я уверен, что мы разделяем схожие интересы и работаем/будем работать в схожих отраслях. Итак, подключаемся через LinkedIn и Github. Пожалуйста, не стесняйтесь отправить запрос на контакт!