В начале 2021 года Tesla сообщила, что нанимает команду маркировщиков данных на своей Gigafactory в Нью-Йорке для поддержки маркировки изображений и помощи в обучении нейронных сетей Autopilot/FSD. Согласно ранее опубликованным данным, в команде по маркировке данных Tesla работает около 1000 человек.
В прошлом году руководитель AI в Tesla сообщил, что в компании всего «десятки» инженеров, работающих над нейронными сетями, но есть «огромная» команда, работающая над этикетками. С одной стороны, ручная качественная маркировка данных по-прежнему является основой, а с другой стороны, автоматическая маркировка данных также является тенденцией для обработки большого объема данных, собираемых автопарками. Группа аннотаций будет взаимодействовать с инженерами по компьютерному зрению из команды Autopilot, чтобы улучшить дизайн внутренних инструментов аннотаций. В то же время команда аннотаторов получит базовые знания в области компьютерного зрения и машинного обучения, чтобы лучше понять, как работают алгоритмы для маркировки данных.
На самом деле, сообщение, стоящее за этим, заключается в том, что маркировка данных — это не просто «маркировка ограничительной рамки» и не просто маркировка объектов один за другим. «Этот метод требует много времени и денег». Некоторые отраслевые инсайдеры отметили, что данные о результатах, предоставляемые традиционными аутсорсерами, исправлялись много раз, но они по-прежнему не соответствуют требованиям клиентов к точности.
Вполне предсказуемо, что следующей волной маркировки данных станут автоматизированные инструменты. Причина в том, что с постепенным увеличением масштабов новых транспортных средств, оснащенных функциями сбора и возврата данных, обработка огромных данных стала жесткой необходимостью. Это означает, что эффективность и точность маркировки определяют скорость итерации технологий компьютерного зрения и многоинтеграционного восприятия. «Высококачественные данные в некотором смысле являются решающим фактором». По мнению профессионалов отрасли, качественные и эффективные данные также являются ключом к ускорению цикла разработки функций.
Являясь ведущим в мире поставщиком услуг данных ИИ, Datatang также запустила самостоятельно разработанный инструмент аннотирования данных со встроенной функцией предварительного распознавания с помощью ML, который действительно реализует полуавтоматическую обработку данных и может эффективно повысить эффективность на душу населения. более чем на 30%. Почти 30 наборов инструментов аннотирования можно гибко применять для аннотирования различных типов данных, таких как голос, изображение, трехмерное облако точек и текст, и они были успешно применены при реализации почти 5000 проектов за 11 лет.
Например, отсутствие маркировки является серьезной ошибкой маркировки. Datatang имеет встроенные алгоритмы обнаружения грунта и автоматическую цветопередачу в инструменте. При маркировке вы можете судить о отмеченных объектах по цвету, чтобы уменьшить отсутствующую маркировку. Кроме того, этот инструмент также имеет встроенную функцию предварительной разметки алгоритма интерполяции. Если идентификатор цели отмечен в первом и пятом кадрах, положение промежуточного кадра будет отмечено автоматически, просто проверьте или точно настройте положение.
В дополнение к инструментам аннотирования данных Datatang также предоставляет готовые наборы обучающих данных. Datatang имеет 65 000 часов голосовых наборов данных в салоне и более 100 наборов наборов данных компьютерного зрения, помогая нашим клиентам в разработке технологий автономного вождения.
● Наборы речевых данных в салоне
Данные речи японцев на английском языке по мобильному телефону
Набор данных записан носителями японского языка, сбалансированными по полу. Корпус записей богат содержанием и охватывает широкий спектр областей, таких как общее управление и контроль, взаимодействие человека и машины, умный дом и автомобиль.
Данные разговорной речи на хинди по мобильному телефону
Около 1000 спикеров участвовали в записи и вели общение лицом к лицу в естественной форме. У них была свободная дискуссия по ряду заданных тем в самых разных областях; голос был естественным и плавным, в соответствии с реальной сценой диалога.
Данные британской речи по мобильному телефону
Данные записаны носителями британского языка. Содержимое записи охватывает множество категорий, таких как общие, интерактивные, автомобильные и умные дома.
Китайско-английский смешанный среднетональный корпус синтеза речи-обслуживание клиентов
Он записан носителями китайского языка, текст обслуживания клиентов, а слоги, фонемы и тона сбалансированы. В аннотации участвует профессиональный фонетик.
● Наборы данных компьютерного зрения
Мультигонка — сбор данных о поведении водителей
Данные включают несколько возрастов, несколько периодов времени и несколько рас (европейцев, черных, индейцев). Поведение водителя включает опасное поведение, усталостное поведение и визуальное движение.
Данные распознавания поведения пассажиров
Данные включают несколько возрастных групп, несколько периодов времени и несколько рас (европейцев, черных, индейцев). Поведение пассажиров включает нормальное поведение пассажиров, ненормальное поведение пассажиров (укачивание автомобиля, сонливость, поведение потерянных вещей).
50 типов данных динамического распознавания жестов
Данные охватывают мужчин и женщин. Распределение по возрасту колеблется от подростка до старшего. Разнообразие данных включает несколько сцен, 50 типов динамических жестов, 5 фотографических ракурсов, различные условия освещения, различные фотографические расстояния.
Кроме того, Datatang также поддерживает службы сбора данных по запросу для клиентов, такие как сбор данных о поведении персонала в кабине экипажа, сбор данных 2D-вида улиц, а также многоязычный и многогрупповой голосовой сбор в сценариях вождения.
Конец
Если вам нужны услуги передачи данных, свяжитесь с нами: info@datatang.com.