Мне говорили, что в разговоре я вскакиваю и заканчиваю предложения других людей за них. Теперь для этого есть приложение: GPT-2, выпущенное OpenAI, основанным Илоном Маском. GPT-2 — это программа на естественном языке, которая по подсказке будет писать (в основном) понятный контент. Заявленная миссия OpenAI состоит в том, чтобы обеспечить, чтобы искусственный общий интеллект (AGI)… приносил пользу всему человечеству. Обработка естественного языка (NLP) включает такие приложения, как классификация текста, создание языка, ответы на вопросы, языковой перевод и распознавание речи.

GPT-2 — это более слабая версия полной программы, разработанной OpenAI, но в значительной степени держащейся в секрете. Организация обеспокоена тем, что ее возможности настолько сильны, что они могут, как выразился критик Джереми Ховард (австралийский специалист по данным и предприниматель), распространять «технологию, чтобы полностью заполнить Twitter, электронную почту и Интернет разумно звучащим контекстом». -подходящей прозой, которая заглушила бы всю остальную речь и которую невозможно было бы отфильтровать».

Как сказано в этой статье об опасностях, которых опасаются, OpenAI заявила, что ее новая модель естественного языка, GPT-2, обучена предсказывать следующее слово в выборке из 40 гигабайт интернет-текста. Конечным результатом стала система, генерирующая текст, который адаптируется к стилю и содержанию обуславливающего текста, позволяя пользователю «создавать реалистичные и связные продолжения темы по своему выбору. “

Я попробовал общедоступный интерфейс к GPT-2 с вводной фразой Когда Черчилль заменил Чемберлена…, и GPT-2 продолжил:

«с королем Георгом VI и Георгом VII с королем Георгом VIII британский парламент принял то, что называлось Актом о развитии внешней политики Великобритании…»

«В 1939 году британская разведка участвовала в создании плана покушения на премьер-министра Великобритании Невилла Чемберлена и его сообщников… Британцам не удалось добиться полномасштабной победы над американскими войсками»

Если вы попробуете это несколько раз, то каждый раз будете получать совершенно разные результаты. Алгоритм представляет собой своего рода механизм прогнозирования; его обучающие данные состоят из постов Reddit на 40 гигабайт. Большой прогресс последних пяти лет состоял в расширении предсказания за пределы локальной задачи предсказания следующего слова до более глобальной задачи предсказания осмысленной последовательности слов. Глубокое обучение и, в частности, повторяющиеся нейронные сети (RNN) сыграли ключевую роль. Фактор RNN в последовательных зависимостях, который является ключом к способности придумывать фразы, которые имеют смысл в целом, как сами по себе, так и в сочетании с указанным предикатом. Это также объясняет, почему случайные элементы в алгоритме могут привести к тому, что различные текстовые последовательности, сгенерированные из одного и того же предиката, будут настолько непохожи друг на друга — пока они имеют смысл и логически связаны с предикатом, они являются одинаково достоверными результатами.

Если задуматься об этом серьезно, трудно представить, почему компьютеры должны иметь возможность писать текст, который большинству людей было бы трудно отличить от написанного человеком. Но технология есть, и надеяться, что плохие актеры не будут ее использовать, все равно, что надеяться, что вода побежит в гору. Тем не менее, обнародование возможностей ИИ и связанных с ним опасностей может быть лучшим способом защититься от его пагубных последствий, позволяя противодействующим технологиям обнаруживать текст, написанный алгоритмами.

Поговорите с одним из наших экспертов, чтобы обсудить, как Elder Research может использовать передовые методы машинного обучения и искусственного интеллекта, чтобы повысить эффективность вашего следующего проекта НЛП. Хотите узнать больше самостоятельно? Statistics.com предлагает десятки полностью онлайн-курсов — узнать больше.

Связанный

Сложный анализ текста — это сложно, но это работает

5 основных причин провала аналитических проектов

Почему важна информационная грамотность в высшем руководстве

Найм консультанта по аналитике данных

Первоначально опубликовано на https://www.elderresearch.com.