Как автоматизированные инструменты маркировки данных питают автономные транспортные средства

В начале 2021 года Tesla сообщила, что нанимает команду маркировщиков данных на своей Gigafactory в Нью-Йорке для поддержки маркировки изображений и помощи в обучении нейронных сетей Autopilot/FSD. Согласно ранее опубликованным данным, в команде по маркировке данных Tesla работает около 1000 человек.

В прошлом году руководитель AI в Tesla сообщил, что в компании всего «десятки» инженеров, работающих над нейронными сетями, но есть «огромная» команда, работающая над этикетками. С одной стороны, ручная качественная маркировка данных по-прежнему является основой, а с другой стороны, автоматическая маркировка данных также является тенденцией для обработки большого объема данных, собираемых автопарками. Группа аннотаций будет взаимодействовать с инженерами по компьютерному зрению из команды Autopilot, чтобы улучшить дизайн внутренних инструментов аннотаций. В то же время команда аннотаторов получит базовые знания в области компьютерного зрения и машинного обучения, чтобы лучше понять, как работают алгоритмы для маркировки данных.

На самом деле, сообщение, стоящее за этим, заключается в том, что маркировка данных — это не просто «маркировка ограничительной рамки» и не просто маркировка объектов один за другим. «Этот метод требует много времени и денег». Некоторые отраслевые инсайдеры отметили, что данные о результатах, предоставляемые традиционными аутсорсерами, исправлялись много раз, но они по-прежнему не соответствуют требованиям клиентов к точности.

Вполне предсказуемо, что следующей волной маркировки данных станут автоматизированные инструменты. Причина в том, что с постепенным увеличением масштабов новых транспортных средств, оснащенных функциями сбора и возврата данных, обработка огромных данных стала жесткой необходимостью. Это означает, что эффективность и точность маркировки определяют скорость итерации технологий компьютерного зрения и многоинтеграционного восприятия. «Высококачественные данные в некотором смысле являются решающим фактором». По мнению профессионалов отрасли, качественные и эффективные данные также являются ключом к ускорению цикла разработки функций.

Являясь ведущим в мире поставщиком услуг данных ИИ, Datatang также запустила самостоятельно разработанный инструмент аннотирования данных со встроенной функцией предварительного распознавания с помощью ML, который действительно реализует полуавтоматическую обработку данных и может эффективно повысить эффективность на душу населения. более чем на 30%. Почти 30 наборов инструментов аннотирования можно гибко применять для аннотирования различных типов данных, таких как голос, изображение, трехмерное облако точек и текст, и они были успешно применены при реализации почти 5000 проектов за 11 лет.

Например, отсутствие маркировки является серьезной ошибкой маркировки. Datatang имеет встроенные алгоритмы обнаружения грунта и автоматическую цветопередачу в инструменте. При маркировке вы можете судить о отмеченных объектах по цвету, чтобы уменьшить отсутствующую маркировку. Кроме того, этот инструмент также имеет встроенную функцию предварительной разметки алгоритма интерполяции. Если идентификатор цели отмечен в первом и пятом кадрах, положение промежуточного кадра будет отмечено автоматически, просто проверьте или точно настройте положение.

В дополнение к инструментам аннотирования данных Datatang также предоставляет готовые наборы обучающих данных. Datatang имеет 65 000 часов голосовых наборов данных в салоне и более 100 наборов наборов данных компьютерного зрения, помогая нашим клиентам в разработке технологий автономного вождения.

● Наборы речевых данных в салоне

Данные речи японцев на английском языке по мобильному телефону

Набор данных записан носителями японского языка, сбалансированными по полу. Корпус записей богат содержанием и охватывает широкий спектр областей, таких как общее управление и контроль, взаимодействие человека и машины, умный дом и автомобиль.

Данные разговорной речи на хинди по мобильному телефону

Около 1000 спикеров участвовали в записи и вели общение лицом к лицу в естественной форме. У них была свободная дискуссия по ряду заданных тем в самых разных областях; голос был естественным и плавным, в соответствии с реальной сценой диалога.

Данные британской речи по мобильному телефону

Данные записаны носителями британского языка. Содержимое записи охватывает множество категорий, таких как общие, интерактивные, автомобильные и умные дома.

Китайско-английский смешанный среднетональный корпус синтеза речи-обслуживание клиентов

Он записан носителями китайского языка, текст обслуживания клиентов, а слоги, фонемы и тона сбалансированы. В аннотации участвует профессиональный фонетик.

● Наборы данных компьютерного зрения

Мультигонка — сбор данных о поведении водителей

Данные включают несколько возрастов, несколько периодов времени и несколько рас (европейцев, черных, индейцев). Поведение водителя включает опасное поведение, усталостное поведение и визуальное движение.

Данные распознавания поведения пассажиров

Данные включают несколько возрастных групп, несколько периодов времени и несколько рас (европейцев, черных, индейцев). Поведение пассажиров включает нормальное поведение пассажиров, ненормальное поведение пассажиров (укачивание автомобиля, сонливость, поведение потерянных вещей).

50 типов данных динамического распознавания жестов

Данные охватывают мужчин и женщин. Распределение по возрасту колеблется от подростка до старшего. Разнообразие данных включает несколько сцен, 50 типов динамических жестов, 5 фотографических ракурсов, различные условия освещения, различные фотографические расстояния.

Кроме того, Datatang также поддерживает службы сбора данных по запросу для клиентов, такие как сбор данных о поведении персонала в кабине экипажа, сбор данных 2D-вида улиц, а также многоязычный и многогрупповой голосовой сбор в сценариях вождения.

Конец

Если вам нужны услуги передачи данных, свяжитесь с нами: info@datatang.com.

Как автоматизированные инструменты маркировки данных питают автономные транспортные средства

Вопросы по теме