Как ИИ извлекает смысл из текста? Это не так просто и определенно не так просто, как вы думаете.

Автор Бен Диксон

В сентябре Институт искусственного интеллекта Аллена (AI2) представил компьютерную программу c под названием Aristo, которая могла правильно отвечать более чем на 90 процентов вопросов в ходе экзамена по естествознанию для восьмых классов. Сдать экзамен в средней школе может показаться обыденным, но для компьютеров это сложно.

Аристо нашел ответы среди миллиардов документов, используя обработку естественного языка (NLP), раздел информатики и искусственного интеллекта, который позволяет компьютерам извлекать значение из неструктурированного текста. Хотя мы все еще далеки от машин, которые могут понимать и говорить на человеческом языке, НЛП стало ключевым во многих приложениях, которые мы используем каждый день, включая цифровых помощников, веб-поиск, электронную почту и машинный перевод.

Слова трудны

Воспроизведение возможностей человеческого разума по обработке языков является исторической проблемой для искусственного интеллекта. Представьте себе агента ИИ, который должен отвечать на запросы о погодных условиях; он должен понимать, как можно по-разному спрашивать о погоде:

  • Какая сегодня погода?
  • Завтра пойдет дождь?
  • Когда прекратится дождь?
  • В Чикаго солнечно?
  • Будет ли завтра теплее?
  • Какие дни на следующей неделе будут солнечными?

И во многих случаях язык несет в себе скрытые значения, которые подразумевают общие знания о мире и о том, как связаны предметы. Рассмотрим следующие вопросы:

  • Будет ли завтра хорошая погода для футбола?
  • На кухне идет снег?

Любой человек, услышавший первое предложение, будет знать, что вы неявно спрашиваете, будет ли завтра солнечно или, возможно, просто не будет дождя. Что касается второго предложения, люди знают, что на кухне не идет снег. Но кодирование такого рода базовых знаний и рассуждений в системах искусственного интеллекта всегда было проблемой для исследователей.

Классические подходы к обработке естественного языка использовали символьные системы ИИ, в которых инженеры-программисты явно указывали правила анализа значения языка. Процесс был трудоемким и имел ограниченное применение. Например, разработчикам придется вручную записывать все способы, которыми пользователь может спросить о погоде, а затем давать соответствующий ответ.

Эти системы работали только до тех пор, пока пользователи оставались в рамках своего определенного поведения. Как только они получат новый запрос, который будет немного отличаться от их закодированных правил, они сломаются. Для этого требовалось просить пользователей скорректировать свое поведение с учетом ограничений системы ИИ, что могло бы привести к ошибкам и разочарованию.

Ограничения систем, основанных на правилах, стали еще более очевидными, когда они обрабатывали длинные отрывки текста, состоящие из нескольких предложений, которые требовали большого знания контекста. Это особенно верно в таких областях, как перевод, где преобразование длинного текста с одного языка требует информации об исходном и целевом языках, а также об истории и культуре. В этих случаях поведение ИИ стало настолько неустойчивым, что его использование стало практически невозможным, за исключением очень простых задач.

Глубокое обучение и НЛП

За последние несколько лет произошла революция в глубоком обучении, технике искусственного интеллекта, которая особенно хороша для обработки неструктурированной информации, такой как изображения, звук и текст. Вместо того, чтобы вручную определять поведение алгоритмов глубокого обучения, инженеры-программисты обучают их, предоставляя им множество примеров.

Чтобы обучить алгоритм составления отчетов о погоде, инженеры предоставляют ему множество различных примеров того, как пользователи спрашивают погоду, и как правильно на них отвечать. Алгоритм анализа создает статистическую модель, которая представляет общие черты в последовательности слов, используемых, чтобы спросить о погоде. Затем он может сопоставить новые предложения, которых раньше не видел, с правильными ответами.

Глубокое обучение не только устраняет необходимость в ручном проектировании поведения, но также помогает выполнять гораздо более сложные задачи НЛП, такие как перевод.

Алгоритм глубокого обучения, обученный на большом корпусе документов на английском языке и соответствующих им французских версиях, может найти умные способы делать больше, чем дословный перевод, например находить эквивалентные идиомы и пословицы на языках. В 2016 году Google увидел внезапное улучшение своего сервиса Translate после того, как переключил его на глубокое обучение.

Сегодня большинство приложений НЛП используют те или иные формы глубокого обучения.

Приложения

НЛП оставляет свой след во многих областях, но в некоторых областях достижения в этой области даже проложили путь для новых приложений.

Цифровые помощники. Alexa, Siri и Cortana используют обработку естественного языка для сопоставления ваших предложений с конкретными навыками и приложениями. Благодаря достижениям в области НЛП вы можете разговаривать со своим помощником почти непринужденно. Цифровые помощники могут реагировать на различные простые команды, такие как установка сигналов тревоги и напоминаний, воспроизведение музыки, включение и выключение света.

Служба Google Duplex является примером того, как далеко продвинулось НЛП: с некоторыми оговорками, Duplex может делать заказы от имени пользователя и участвовать в беседах с администраторами. Он также может отслеживать разговоры и извлекать элементы для действий из чатов и электронных писем.

Чат-боты: достижения в области обработки естественного языка за последние несколько лет возобновили интерес к чат-ботам, приложениям, которые заменяют элементы пользовательского интерфейса (кнопки, меню и т. д.) на диалоговые интерфейсы, такие как приложения для обмена сообщениями и социальные сети. .

Вы найдете приложения для кошачьих ботов во многих областях, включая здравоохранение, банковское дело, обслуживание клиентов и новости. Пользователи могут взаимодействовать с чат-ботом, как если бы они взаимодействовали с человеком (почти), например с врачом или консультантом по банковскому делу.

Поиск в Интернете. Раньше поиск в Интернете ограничивался поиском по ключевым словам на веб-страницах. В настоящее время поисковые системы используют такие технологии, как встраивание слов, тип модели ИИ, которая ищет ключевые слова и термины, связанные с исходным поисковым запросом.

Совсем недавно Google включил BERT, современную языковую модель, в свою поисковую систему ​​для дальнейшего улучшения результатов поиска. Aristo, упомянутый ранее ИИ, также использует разновидность BERT для поиска ответов на научные вопросы в своем корпусе научных материалов.

Электронная почта: многие службы электронной почты используют NLP для обнаружения и фильтрации спама. Кроме того, такие функции, как автозаполнение и интеллектуальное сочинение, используют NLP, чтобы взять на себя часть набора текста пользователем, особенно на мобильных устройствах.

Социальные сети: платформы социальных сетей используют НЛП для множества задач, включая обнаружение разжигающих ненависть высказываний (или попытки), оценку настроений в содержании постов и пометку постов с суицидным содержанием.

Пределы текущего НЛП

Несмотря на гибкость, которую глубокое обучение придает НЛП, нынешний ИИ все еще далек от понимания языка, как это делают люди.

Модели глубокого обучения обязаны своей точностью огромным объемам данных, на которых они обучаются. Чем больше примеров видит система ИИ, тем больше у нее шансов найти ответы на вопросы, на которые она должна ответить. По сути, глубокое обучение заключается в сопоставлении с образцом с использованием сложной математики для сопоставления входных данных с выходными на основе статистики и сходства. А сопоставление с образцом отличается от понимания значения слов и предложений.

Фактически, языковые модели, основанные на глубоком обучении, по-прежнему страдают от некоторых из тех же фундаментальных проблем, что и их предшественники, основанные на правилах. Когда они вовлекаются в задачи, требующие общих знаний о людях и предметах, языковые модели глубокого обучения часто допускают глупые ошибки. Вот почему многие компании до сих пор нанимают тысячи людей-операторов, чтобы направлять алгоритмы ИИ в правильном направлении.

Честно говоря, настоящая обработка естественного языка, вероятно, не станет возможной, пока мы не взломаем код ИИ человеческого уровня, синтетического интеллекта, который действительно работает как человеческий мозг. Но по мере того, как мы приближаемся к этой неуловимой цели, наши открытия помогают преодолеть разрыв в коммуникации между людьми и компьютерами.

Первоначально опубликовано на https://www.pcmag.com 23 декабря 2019 г.