Компьютеры теперь слушают лучше, чем люди

Обработка естественного языка (NLP) добилась больших успехов в последние годы, и совсем недавно Microsoft установила новый рекорд по распознаванию речи. Исследователи Microsoft достигли уровня ошибок в словах 5,1% для своей системы распознавания разговорной речи в Оценочном наборе Switchboard 2000. Что важно в этой частоте ошибок, так это то, что точность программы теперь находится на одном уровне с профессиональными расшифровщиками.

В прошлом году та же исследовательская группа Microsoft достигла уровня ошибок 5,9%. Что отличалось на этот раз, так это введение дополнительной модели, сверточной нейронной сети в сочетании с двунаправленной долговременной памятью (CNN-BLSTM). Развитие сверточных нейронных сетей для работы с НЛП сыграло большую роль в достижении этих вех. Кроме того, увеличение мощности графического процессора и производительности сыграло роль в скорости и эффективности моделей обучения.

Еще одним важным фактором этой новой более низкой ошибки является то, что в этой системе распознавания речи исследователи позволили распознавателю использовать целые разговоры. Это важно, поскольку заставляет машину учиться обрабатывать гораздо больше, чем люди, которые во время разговора могут предсказать, какие слова или фразы могут быть следующими.

Microsoft указывает на свою службу Speech Translator как на прямой результат достижений в NLP. Этот сервис может переводить презентации в режиме реального времени для многоязычной аудитории.

НЛП имеет долгую историю, и можно сказать, что формально она началась в 1950 году со статьи Алана Тьюринга Вычислительные машины и интеллект. разговаривал с компьютером, не осознавая, что это машина. С тех пор было предпринято много попыток улучшить машинный перевод и языковую обработку. Большинство детей 90-х пробовали чат-боты AOL Instant Messenger. И сегодня существуют различные чат-боты и цифровые помощники, использующие НЛП.

Что хорошего в этом достижении, так это то, что эти возможности распознавания речи используются в реальных службах Microsoft, таких как Cortana. НЛП можно использовать в самых разных приложениях, а не только в интеллектуальных личных помощниках, которые мы знаем сегодня. НЛП можно использовать для обработки неструктурированного текста в медицинских записях. Еще одним важным применением является машинный перевод, который может улучшить доступ к информации для людей, преодолевающих языковые барьеры. Двигаясь вперед, исследователи будут стремиться научить машины понимать намерения и смысл речи, что откроет совершенно новые границы использования и приложений.

Twitter: @yina_ml
LinkedIn: yinamoelange
Первоначально опубликовано на www.2021.ai

Компьютеры теперь слушают лучше, чем люди

Вопросы по теме