A 5 лучших инструментов маркировки для создания наборов данных компьютерного зрения

Полную статью в блоге Sicara читайте здесь.

В этой статье представлены 5 замечательных инструментов для аннотаций, которые, я надеюсь, помогут вам создавать наборы данных компьютерного зрения.

Если вы специалист по данным, работающий в области компьютерного зрения, вы, вероятно, также поняли, что вам также нужна быстрая и простая маркировка l по крайней мере по одной из этих двух причин:

  • для создания наборов данных для PoC или R&D экспериментов.
  • чтобы обеспечить качество ваших данных, чтобы они не повлияли на производительность ваших алгоритмов глубокого обучения.

Я глубоко погрузился в мир маркировки компьютерного зрения и понял, что он наполнен довольно внушительным количеством инструментов (см. Эти три удивительных списка здесь, здесь и там или этот пост в блоге). Я потратил некоторое время, сравнивая наиболее многообещающие (и активные) проекты, чтобы узнать, что большинство этих инструментов были разработаны для достижения только одной из трех целей:

  1. Если вы хотите открыть бизнес по маркировке и вам нужны:
    - расширенные возможности управления проектами
    - множество функций, позволяющих выполнить любую задачу
    - инструменты автоматизации для повышения эффективности
  2. Если вы работаете в стартапе, вам, вероятно, потребуются:
    - API или, по крайней мере, простые способы подключения инструмента маркировки к частным API
    - интуитивно понятный пользовательский интерфейс (UX), поэтому каждый нанимаемый вами аннотатор может мгновенно начать работу
  3. Если вы работаете самостоятельно и:
    - не заботитесь об API / управлении проектами
    - просто хотите начать добавлять теги как можно быстрее!

Вот быстрый список моих любимых инструментов, которые позволяют аннотировать ограничивающие рамки (обнаружение) и многоугольники (сегментация) для приложений компьютерного зрения.

Если вы обнаружите, что эти инструменты не работают должным образом, попробуйте запустить их в Chrome!

[Необязательно] Краткие сведения о маркировке в компьютерном зрении

В компьютерном зрении в основном используются данные трех типов для обучения ваших алгоритмов:

  1. Картинка + метка для обучающих классификаторов (ResNets)
  2. Ограничительная рамка + этикетка для детекторов (YOLOv3, Faster R-CNN…)
  3. Многоугольник + метка для приложений сегментации (Маска R-CNN)

Как вы также, вероятно, поняли, одним из наиболее важных факторов успеха проекта AI является количество «качественных данных», которые вы можете использовать. Под «данными о качестве» для приложений компьютерного зрения я подразумеваю:

  • каждое изображение / аннотация имеет соответствующий ярлык
  • каждый ограничивающий прямоугольник или многоугольник точно окружает объект, на котором нужно тренироваться »

Несмотря на то, что последнему определению явно не хватает объективности, мы хотим, чтобы наши алгоритмы обеспечивали производительность человеческого уровня. Таким образом, нам необходимы аннотации «человеческого уровня».

Хотите увидеть больше инструментов? Читай полную статью здесь".