Обнаружение объектов — это компьютерная технология, связанная с компьютерным зрением и обработкой изображений, которая обнаруживает экземпляры семантических объектов определенного класса в цифровых изображениях и видео.

В сегодняшней статье мы поговорим о шести пользовательских проектах по обнаружению объектов с открытым исходным кодом, которые помогут улучшить ваши навыки в области компьютерного зрения и обработки изображений.

Примечание. В этой статье мы поговорим о некоторых не очень известных, но действительно хороших проектах обнаружения пользовательских объектов с открытым исходным кодом, которые вы можете использовать в своих проектах. Чтобы узнать больше о каждом из них, я рекомендую перейти по ссылке, указанной вдоль проекта.

Бонус

Отличное обнаружение объектов. Это список замечательных статей об обнаружении объектов.

Репозиторий Github

Документация

Обучение — это не только повышение компетентности в своей работе. Это гораздо больше. Datacamp позволяет мне учиться без ограничений.

Datacampпредоставляет вам гибкость, необходимую для прохождения курсов в свободное время и изучения основных навыков, необходимых для перехода к успешной карьере.

Datacamp научил меня быстро улавливать новые идеи и применять их к реальным проблемам. Пока я был на этапе обучения, Datacamp зацепил меня всем, что происходит на курсах, от содержания курсов и отзывов ассистентов до встреч и твитов профессора.

Вот некоторые из моих любимых курсов, которые я настоятельно рекомендую вам изучать, когда это соответствует вашему графику и настроению. Вы можете напрямую применить концепции и навыки, полученные на этих курсах, в новом увлекательном проекте на работе или в университете.

  1. Data-scientist-with-python
  2. Data-scientist-with-r
  3. Ученый-машинное обучение-с-r
  4. Ученый-машинное обучение-с-питоном
  5. Машинное обучение для всех
  6. Наука о данных для всех
  7. Data-engineer-with-python
  8. Дата-аналитик-с-питоном
  9. Основы больших данных через pyspark

Возвращаясь к теме —

1. Ммобнаружение

Гитхаб

Официальная документация

"Бумага"

MMDetection — это инструментарий для обнаружения объектов с открытым исходным кодомна основе PyTorch. Это часть проекта OpenMMLab. Вы также можете использовать его для вывода, тестирования и обучения предопределенных моделей с помощью настраиваемых наборов данных. Обучение для индивидуализированного набора данныхописывается тремя шагами ниже:

  1. Подготовьте настроенный набор данных
  2. Подготовить конфигурацию
  3. Обучайте, тестируйте и выводите модели на основе настроенного набора данных.

Основные особенности

Модульная конструкция

  • Мы разбиваем инфраструктуру обнаружения на разные компоненты, и можно легко создать индивидуальную инфраструктуру обнаружения объектов, комбинируя другие модули.

Поддержка нескольких фреймворков из коробки

  • Набор инструментов напрямую поддерживает популярные и современные платформы обнаружения, например. Быстрее RCNN, Mask RCNN, RetinaNet и т. д.

Высокая эффективность

  • Все основные операции с блоками и масками выполняются на графических процессорах. Скорость обучения выше или сравнима с другими кодовыми базами, включая Detectron2, maskrcnn-benchmark и SimpleDet.

Уровень развития

  • Набор инструментов основан на кодовой базе, разработанной командой MMDet, которая выиграла конкурс COCO Detection Challenge в 2018 году, и мы продолжаем развивать его.

2. Темный поток

Гитхаб

Статья: версия 1, версия 2.

Darkflow — это переведенная версия даркнета в TensorFlow. Загрузка обученных весов, переобучение/точная настройка с помощью TensorFlow, регулярный экспорт определений графиков на мобильные устройства. В основном он используется для обнаружения объектов в реальном времени и классификации.

Он реализован в Python3, Tensorflow 1.0, NumPy, OpenCV 3.

Это может помочь вам с:

  • Анализ аннотаций
  • Дизайн сети
  • Поток графа с помощью потока
  • Обучение новой модели
  • Обучение набору данных
  • Демонстрация камеры/видеофайла
  • Использование darkflow из другого приложения Python
  • Сохраните построенную диаграмму в файл protobuf (.pb)

3. ИмиджИИ

Гитхаб

Официальная документация

Страница ImageAI

ImageAI – это современный ИИ для распознавания и обнаружения с несколькими строками кода. Моисей Олафенва и Джон Олафенва.

ImageAI – это простая в использовании библиотека Computer Vision Python, которая позволяет разработчикам легко интегрировать самые современные искусственные Анализ функций в существующих приложениях и системах.

Построенный с учетом простоты, ImageAI поддерживает список современных алгоритмов машинного обучения для прогнозирования изображения, прогнозирования пользовательского изображения, обнаружения объектов, отслеживания видеообъектов и обучения прогнозированию изображений.

ImageAI в настоящее время поддерживает прогнозирование изображений и обучение с использованием четырех различные алгоритмы машинного обучения, обученные на наборе данных ImageNet-1000. ImageAI также поддерживает обнаружение объектов, обнаружение видео и отслеживание объектовс использованием RetinaNet, YOLOv3и TinyYOLOv3 обучен набору данных COCO. Наконец, ImageAI позволяет подготовить пользовательские модели для обнаруженияи распознавание новых объектов.

Со временем ImageAI обеспечит поддержку более широких и специализированных аспектов Computer Vision, включая распознавание изображений в уникальных средах и специальных полях.

4. ГлюонCV

Гитхаб

Официальная документация

GluonCV предоставляет реализации самых современных (SOTA) моделей глубокого обучения вкомпьютерном зрении.

Этот инструментарий предлагает четыре основные функции:

  1. Обучение скриптов воспроизведению результатов SOTA, описанных в научных статьях
  2. Поддерживает PyTorch и MXNet
  3. Большое количество предварительно обученных моделей
  4. Мощный, легкий, гибкий и удобный для развертывания репозиторий
  5. Тщательно разработанные API, которые значительно упрощают реализацию

Он поддерживает различные приложения, включая:

  • Классификация изображений
  • Обнаружение объектов
  • Семантическая сегментация
  • Сегментация экземпляров
  • Оценка позы
  • Распознавание действий

5. АделаиДет

Гитхаб

AdelaiDetявляется открытым исходным кодом набором инструментов для обнаружения нескольких экземпляров и задачи распознаванияповерх Detectron2.

На сегодняшний день в AdelaiDet реализованы следующие алгоритмы:

Модели, реализованные в AdelaiDet, включают:

  • Базовые показатели обнаружения объектов COCO с помощью FCOS
  • Базовые показатели сегментации экземпляров COCO с помощью BlendMask
  • Базовые показатели сегментации экземпляров COCO с помощью MEInst
  • Результаты Total_Text с ABCNet
  • Базовые показатели сегментации экземпляров COCO с помощью CondInst

6. YOLOv3_TensorFlow

Гитхаб

Внедрение TensorFlow YOLO v3 с поддержкой обучения на вашем наборе данных.

Он содержит полный процесс обучения и оценки вашего собственного набора данных. Ключевые особенности этого репозитория:

  • Эффективный тф. конвейер данных
  • Преобразователь весов (преобразование предварительно обученных весов даркнета в наборе данных COCO в контрольную точку TensorFlow.)
  • Чрезвычайно быстрое немаксимальное подавление графического процессора.
  • Полный процесс обучения и оценки.
  • Алгоритм Kmeans для выбора предыдущих блоков привязки.

Если вам понравилось читать эту статью, я уверен, что мы разделяем схожие интересы и работаем/будем работать в схожих отраслях. Итак, подключаемся через LinkedIn и Github. Пожалуйста, не стесняйтесь отправить запрос на контакт!