Float Inc — автономный стартап в области микромобильности, работающий над приложениями компьютерного зрения для микромобильности. Они разрабатывают автономное средство доставки, которое может доставлять небольшие посылки.

Технология компьютерного зрения Float предназначена для автоматического обнаружения препятствий и распознавания дорожных и дорожных знаков во время доставки посылки нужному клиенту в ожидаемое время доставки.

Проблема

Float сгенерировал несколько часов видео с тротуаров, разделив их на отдельные кадры. Чтобы достичь высокого уровня точности и точных результатов, команда исследователей данных Float должна снабжать свои нейронные сети огромным количеством тренировочных данных.

Затем они кропотливо аннотировали каждое препятствие, дорогу и дорожный знак в каждом кадре. Таким образом, они смогли нанести на изображение координаты человека или продукта. Затем это укажет алгоритму, что область на изображении принадлежит человеку или продукту.

Это важная, но чрезвычайно трудоемкая часть обязанностей их команды по науке о данных. Этот процесс может занимать до 70% их времени и часто отвлекает внимание команды от других важных задач. Аннотирование обучающих данных собственными силами было экономически неэффективным и утомительным для команды.

Решение

Вместе мы обсудили, какое решение лучше всего соответствует их потребностям. Компании Float требовались точные аннотации для достижения оптимальной производительности и быстрого выполнения работ.

Мы начали с понимания контекста, в котором будет работать средство доставки, и начали процесс аннотирования.

Они хотели, чтобы их набор данных был аннотирован в соответствии с классификацией набора данных Cityscape. Набор данных Cityscapes фокусируется на семантическом понимании городских уличных сцен, и после быстрого анализа набора данных мы решили, что должны аннотировать каждое изображение примерно 15 классами.

Они настаивали, в частности, на точности аннотаций. Даже несколько небольших ошибок могут генерировать слишком много шума и резко снижать оценку алгоритма прогнозирования.

В Skyrand собственная команда обученных аннотаторов позволяет нам работать быстро и адаптироваться к потребностям наших клиентов.

Результаты

В течение пары недель мы смогли провести полную семантическую сегментацию более 20 000 изображений с примерно 100 000 классификаций для всех изображений, обеспечивая при этом высококачественные результаты и превосходную точность.