Прочитайте все исследование здесь, а также будьте в курсе других наших исследований.

Фон

Обнаружение объектов — одно из основных направлений исследований в области современных технологий, ориентированных на машинное обучение и компьютерное зрение. В последнее время обнаружение изображений достаточно изменилось, чтобы решать реальные проблемы. Аннотации и аннотаторы являются ключевыми игроками, которых необходимо использовать для помощи в развитии искусственного интеллекта посредством машинного обучения и компьютерного зрения, чтобы сделать все это возможным.

Где важна аннотация данных?

Аннотации служат важным определением в областях компьютерного зрения, таких как биометрическое обнаружение лиц, обнаружение движения, например движение пешеходов и отпечаток движения, и системы обнаружения наблюдения, такие как камеры видеонаблюдения, для обучения их выполнению специально идентифицированных визуализаций и составлению отчетов. . Annotation также позволяет автономным транспортным средствам, таким как Tesla, автоматически маневрировать с помощью автоматизированной усовершенствованной системы помощи водителю, которая повышает безопасность и удобство за рулем. В параллельном мире точные аннотации и маркировка также могут позволить водителям спокойно спать за рулем, оставаясь при этом в безопасности и с меньшей вероятностью посягая на защиту других участников дорожного движения.

Как аннотирование данных может помочь в машинном обучении?

Аннотации широко используются в машинном обучении, а машинное обучение — это контролируемый прогрессивный принцип компьютерного обучения, который в настоящее время широко используется в современных системах автоматизации. Обнаружение изображений включает в себя маркировку данных, когда набор данных, помеченный человеком, используется для обучения компьютерной модели обнаружения. Это человеческое навешивание ярлыков и есть то, что мы называем аннотацией. Оперативность любого прогрессивного компьютерного обучения в основном зависит от качества аннотированных наборов данных. Подчеркнем, что фон для успеха в машинном обучении в первую очередь связан с объемом и качеством аннотированных данных, которые будут использоваться в машинном обучении. Процесс ручной аннотации — это именно то место, где возникает проблема. Сбор высококачественных и самых разнообразных наборов данных для аннотированной маркировки — решающая задача между созданием профессиональной модели обнаружения объектов и/или неудачей.

Какие существуют форматы данных в Annotation?

В аннотации данных используются различные наборы данных, и они продолжают масштабироваться по мере развития технологий. Эти наборы данных все чаще позволяют обнаруживать поверхности, и они в основном включают форматы наборов данных, такие как Pascal Voc, MS Coco, Open Images и Kitti.

Обычно разработчики систем искусственного интеллекта сегодня используют аутсорсинг процесса аннотирования и маркировки данных для решения трудоемкой и утомительной задачи аннотации. Услуги точных аннотаций от Annotation Labs для снижения нагрузки. У них есть профильные специалисты, работающие с различными наборами изображений, видео, аудио и текстовых данных. Следовательно, это создает спрос на удобные инструменты аннотирования, которые помогают в подготовке помеченных наборов данных, расширяющих возможности машинного обучения.

Какова стоимость аннотирования и маркировки данных?

Исследователи постоянно ищут механизмы для снижения стоимости аннотаций изображений. Разрабатываются различные подходы к сокращению затрат, позволяющие компьютерным системам эффективно обучаться; к ним относятся слабо контролируемые и активные модели обучения. В модели со слабым наблюдением изображения и согласованные метки объектов имеют форму ограничивающих рамок. В качестве альтернативы, активное обучение обучает модель аннотаций и получает данные от человека для рисования ограничивающих рамок на элементах изображения, активно выбранных компьютерными алгоритмами. Однако моделирование аннотаций опирается на людей-аннотаторов для иллюстрации высококачественных ограничивающих рамок.

Подробнее о различных методах аннотирования данных и процессах маркировки здесь.

Что такое повторяющийся подход к обучению аннотации данных?

Подход с повторяющимся обучением снижает рабочую нагрузку по аннотации за счет создания наборов данных обнаружения объектов для конкретной среды. Этот подход хорошо подходит для кампании пакетного аннотирования данных, поскольку он сводит к минимуму рабочую нагрузку аннотатора в режиме реального времени. Один аннотатор сможет аннотировать весь набор данных с помощью частично обученного детектора, если он использует подход с повторяющимся обучением. Повторяющееся обучение проверяет способность к непрерывному обучению. Система может учиться на последовательных задачах, сохраняя при этом знания из предыдущего обучения обнаружению объектов в повторяющемся цикле. Этот подход в равной степени проверяет пагубные привычки систем к забыванию при обнаружении объектов, и он также использует подход с повторяющимся циклом. Пагубное забывание — это привычка систем забывать прежние данные после изучения новых штаммов данных.

Являются ли аннотации вручную критически важными для обеспечения высокой точности аннотаций?

Аннотации объектов значительно продвинулись вперед в области компьютерного зрения. Были начаты обширные исследования, чтобы ускорить аннотацию для компьютерной визуализации. Существует множество предложений и подходов к аннотации ограничивающей рамки. Чтобы ускорить аннотацию, исследователи коллективно пришли к выводу, что аннотатор должен проверять метки аннотаций, предложенные системой, с принятием или отклонением человеческого решения. В подходе с контролем кликов аннотаторы должны отмечать точки в центре объекта на данном изображении. С другой стороны, в подходе с экстремальным щелчком комментатор должен щелкнуть по четырем физическим точкам объекта; сверху, снизу, слева и справа.

Первоначальный подход к аннотации, особенно при работе с пакетами, состоит в том, чтобы сегментировать ваши изображения на равные кластеры, например, на пакеты по 40, 50 или 60, в зависимости от общего количества изображений из немаркированных наборов данных. Этот процесс выполняется вручную и требует участия человека в рисовании ограничивающих рамок и маркировке каждого изображения в заданном наборе данных.

Что такое обучение модели обнаружения объектов при аннотации данных?

Любая модель обнаружения может быть использована для обнаружения объектов; однако акцент должен быть сделан на моделях обнаружения объектов глубокого обучения. Широко используемая модель использует предварительно обученные системы и повторяющееся обучение для новых наборов данных. Отличным подходом к обучению обнаружению объектов было бы использование двух предварительно обученных методов, обученных на наборе данных MS Coco, и циклическое обучение на других широко используемых наборах данных.

Когда аннотаторы завершают моделирование обнаружения объектов с пакетами аннотированных изображений, эти аннотированные наборы данных можно использовать для прогнозирования ограничивающих рамок для других коллекций немаркированных изображений. Этот процесс помогает ускорить рабочие нагрузки, и тогда системы могут предлагать ограничивающие рамки и метки классов для будущих немаркированных пакетов изображений.

Тем не менее, предлагаемые аннотации должны быть проверены и вручную исправлены аннотаторами-людьми. Аннотаторы должны просмотреть все предлагаемые метки и ограничивающие рамки, чтобы исключить неправильно предсказанные рамки и исправить неправильно помеченные классы. По мере того, как все больше и больше моделей данных представляются во время повторяющегося обучения, рабочая нагрузка на человека неизбежно будет снижаться. Таким образом, аннотаторы должны принимать или отклонять блоки в наиболее типичном случае.

Как сократить время, необходимое для аннотирования данных?

Пытаясь оценить рабочие нагрузки в условиях цикла аннотирования, мы сосредоточили внимание на количестве времени, которое человек может потратить на всю кампанию аннотирования. Это возможно путем расчета частоты исправлений с точки зрения пользователя в заданном наборе данных, размечая широко используемые показатели точности и циклов. Точнее, наборы данных должны быть полностью аннотированы, и нам нужно будет обрабатывать их в цикле, чтобы измерить объемы работы, проделанной человеком на каждом этапе, в равной степени наблюдая с разных точек зрения, как аннотатор может сделать это быстрее.

В идеале работа по исправлению ограничивающих рамок занимает значительно меньше времени, чем рисование новых рамок, если модель обнаружения эффективна. На всех этапах исправления собираются полностью промаркированные пакеты, которые используются для обучения моделей обнаружения, чтобы облегчить последовательное обучение системы. Бесконечность обучения модели обнаружения продолжается от вывода ограничивающей рамки, исправлений в предлагаемых циклах аннотаций до момента, когда немаркированные изображения будут полностью помечены. Этот бесконечный процесс предоставляет полностью размеченный набор данных изображения для обнаружения объектов, снижая нагрузку на человека-аннотатора.

Аннотации с повторяющимся обучением были опробованы с различными архитектурами обнаружения и наборами данных. Двумя наиболее часто используемыми конфигурациями являются Faster RCNN (Сверточная нейронная сеть Faster Region) и SDD (Single Shot Detector). Faster RCNN — двухуровневый детектор; система первого уровня создает предложения объектов, за которыми следует система второго уровня, классифицирующая предлагаемые объекты по различным категориям. С другой стороны, SSD представляет собой упрощенную архитектуру обнаружения, которая производит обнаружение за один прямой проход системы. SSD — это предпочтительная архитектура обнаружения объектов в случае минимальных доступных ресурсов. Faster RCNN является наиболее точным в архитектуре обнаружения объектов, тогда как SSD быстрее в выводе. Модели обнаружения играют решающую роль в обучении машинному обучению и обнаружению объектов. Поэтому выбор подходящей модели обнаружения в каждом конкретном случае весьма актуален. Кроме того, важно опробовать различные стратегии, чтобы прийти к наиболее оптимальному методу для получения высококачественной аннотации ограничительной рамки в повторяющемся подходе к обучению.

Другие из нашего исследовательского центра:

~ Полное руководство по аннотации данных, компьютерному зрению, искусственному интеллекту и машинному обучению (2022 г.)

~ Все о ограничивающей рамке изображения, компьютерном зрении и распознавании изображений

~ Почему модерация контента важна для пользовательских кампаний и контента?