Благодаря политике «Один пояс, один путь», ИИ и технологиям облачных вычислений все больше и больше китайских технологических компаний выходят на глобальный уровень. Однако для некоторых компаний, занимающихся искусственным интеллектом, путь за границу по-прежнему сталкивается со многими проблемами. Язык — это одна из проблем, умные продукты, которые могут распознавать местные языки, — мощный инструмент для открытия местного рынка.

Из-за различий между языками производителям ИИ необходимо создавать модели отдельно в соответствии с характеристиками каждого языка. Чтобы обеспечить эффект системы распознавания речи, необходимо использовать качественные обучающие данные разных языков для обучения модели. Однако отсутствие качественных многоязычных обучающих данных становится серьезной проблемой для системы распознавания речи.

Компания Datatang, ведущий мировой поставщик услуг обработки данных ИИ, разработала серию наборов речевых данных на более чем 30 языках. Все данные записываются носителями языка с подписанными авторизационными соглашениями, а качество данных превышает отраслевой стандарт данных.

Данные о немецком языке

Почти 3000 часов немецких речевых данных, данные записаны носителями немецкого языка. Записанный текст разработан экспертами-лингвистами и охватывает общие, интерактивные, бортовые, домашние и другие категории.

Данные французской речи

Почти 1800 часов данных французской речи, данные записаны носителями языка из Франции, Канады и Африки. Текст записи разработан экспертами-лингвистами и охватывает общую интерактивную, автомобильную и домашнюю категории.

Данные испанской речи

Почти 3000 часов испанских речевых данных, данные записаны носителями языка из Испании, Мексики, Колумбии, Венесуэлы и т. д. Записанный сценарий разработан лингвистами и охватывает широкий спектр тем, включая общие, интерактивные, автомобильные и домашние.

Корейские речевые данные

Почти 2000 часов корейских речевых данных, записанных носителями корейского языка. Записи включают экономику, развлечения, новости, устные, цифры, письма.

Данные японской речи

Почти 1000 часов японских речевых данных, данные записаны носителями японского языка. Записанный сценарий разработан лингвистами и охватывает широкий спектр тем, включая общие, интерактивные, автомобильные и домашние.

Речевые данные на хинди

Почти 1500 часов речевых данных на хинди, записанных носителями языка Индии. Акцент аутентичный. Текст записи разработан лингвистами и охватывает общие, интерактивные, автомобильные, домашние и другие категории.

Если приведенные выше данные не могут удовлетворить потребности вашего текущего исследования, Datatang также предоставляет услуги по настройке данных для определенных групп людей, конкретных сценариев и конкретных языков для удовлетворения разнообразных потребностей клиентов в данных.

Конец

Если вам нужны услуги передачи данных, свяжитесь с нами: info@datatang.com