Итак, вы были очарованы возможностями Computer Vision. Давайте сделаем это проще.

Итак, вы были очарованы возможностями Computer Vision. Большинство людей считают это сложным и полным математики. Это также приводит к тому, что многие люди теряют интерес к предмету. Поэтому я решил сделать Computer Vision проще, чем когда-либо прежде.

Итак, представляю Вам Visionlib. Библиотека, которая делает Computer Vision максимально простым.

Вы можете проверить страницу GitHub ЗДЕСЬ

Итак, я покажу вам, как выполнять обнаружение объектов с помощью Visionlib.

Чтобы выполнить обнаружение объектов с помощью библиотеки, все, что вам нужно сделать, это

1. Установите Python3 на свой компьютер.

2. Установите библиотеку Visionlib

3. Запустите пример кода

Итак, давайте начнем

1. Загрузите и установите Python3 с официального сайта.

https://python.org

2. Установите Visionlib и его зависимости

Это должно установить зависимости. Теперь установите Visionlib с помощью

Отлично, теперь, когда вы установили Visionlib и его зависимости,
пришло время написать код.

ВРЕМЯ КОДИРОВКИ

Создайте файл и вставьте этот код. Сохраните код под любым именем, но оно должно заканчиваться на «.py»

Для обнаружения объектов требуется всего 20 строк кода. Никогда не было так просто, верно?

Теперь позвольте мне объяснить, что происходит на самом деле. Давайте разобьем код на маленькие кусочки.

from visionlib.object.detection.detection import ODetection                       import argparse                       
import cv2

Первая строка импортирует модуль обнаружения объектов библиотеки visionlib. Вторая строка импортирует argparse, который анализирует параметры командной строки. Наконец, третья строка импортирует opencv, который является библиотекой обработки изображений.

detector = ODetection()                       parser = argparse.ArgumentParser()                       parser.add_argument("img_path", help="Path to image")                       parser.add_argument("--model", help="The model to use for detecting", dest="model")                       parser.add_argument("--enable-gpu", help="Set to true to enable GPU support",                                           dest="enable_gpu", default=False, type=bool)

Этот фрагмент кода инициализирует анализатор аргументов командной строки, также известный как argparse.

detector = ODetection()
detector.set_detector(args.model)

Здесь все инициализируется. Первая строка инициализирует класс. Второй настраивает детектор на использование. Еще помните argparse, мы можем установить детектор при запуске через командную строку.

box, label, conf = detector.detect_objects(img, enable_gpu=args.enable_gpu)

Вот где происходит волшебство. Это линия, где происходит обнаружение объекта. Мы передаем изображение и логическое значение, указывающее, хотим ли мы использовать GPU. После обнаружения мы получаем три списка, ограничивающую рамку, обнаруженный класс для объекта и доверие к объекту.

dimg = detector.draw_bbox(img, box, label, conf)

Эта линия выполняет тяжелую работу по рисованию ограничивающих рамок, меток и уверенности. После рисования получаем изображение с рисунком.

cv2.imshow("Object Detection using Visionlib", dimg)                       cv2.waitkey(0)

Разве мы не хотим отображать наши обнаруженные изображения. Конечно, мы хотим отобразить изображение. Эти две строки помогают нам отображать изображение.

Это только начало. С Visionlib мы можем не только обнаруживать объекты. Он также может выполнять отслеживание лиц, определение ключевых точек лица, прогнозирование пола и классификацию объектов. Со временем она будет стараться изо всех сил стать библиотекой компьютерного зрения общего назначения. Дополнительные примеры и документацию можно найти на странице Github.



Я буду делиться больше учебника в ближайшее время. Пока

Источники изображений

https://i2.wp.com/miro.medium.com/max/1400/1*EYFejGUjvjPcc4PZTwoufw.jpeg

https://www.pinterest.es/pin/787144841101947609/ [Отредактировано]