Обзор реальных приложений искусственного интеллекта

Мы видели в предыдущем сообщении в блоге, как быстро появляются приложения ИИ. Мы поделились кратким обзором крупных прорывов и выделили ключевые достижения Deepmind (например, устойчивая энергетика, улучшенные вычисления и открытие новых лекарств, и это лишь некоторые из них).

Во второй части мы рассмотрим ключевые разработки OpenAI и то, как они стимулируют инновации.

OpenAI против DeepMind, два гиганта ИИ, решающие разные задачи.

Как сказано в миссии Deepmind: «Мы разрабатываем интеллект, чтобы продвигать науку и приносить пользу человечеству». Таким образом, с глубоким акцентом на обобщенный интеллект, полагаясь на ИИ, способный учиться самостоятельно в любом контексте. Это объясняет, почему все прорывы, описанные в нашем предыдущем сообщении в блоге, основаны на одном и том же подходе: глубоком обучении с подкреплением, когда у ИИ есть просто цель и набор возможных действий, и ему необходимо найти наилучший возможный подход к достижению этой цели.

С другой стороны, заявление о миссии OpenAI сосредоточено на безопасной демократизации ИИ для всего человечества: «Миссия OpenAI состоит в том, чтобы гарантировать, что искусственный общий интеллект (AGI), под которым мы подразумеваем в высшей степени автономные системы, которые превосходят людей по экономическим ценный труд — приносит пользу всему человечеству». Как следствие, модели OpenAI обеспечивают высокоэффективные решения повседневных задач, таких как извлечение данных, генерация текста, распознавание голоса, создание или редактирование изображений и так далее.

Независимо от их соответствующих миссий и целевых приложений, они сходятся в некоторых аспектах, таких как большие модели, поскольку эти модели сегодня играют основополагающую роль в большинстве приложений. Мы подробнее остановимся на этом аспекте в другом сообщении блога, обсуждая их совместные усилия по разработке оптимальных вычислительных больших моделей, например, GPT3, Dalle2, Clip, Whisper для OpenAI, уделяя особое внимание специализированным моделям и мультимодальной общей большой модели GATO Deepmind.

А пока давайте посмотрим на недавние вклады OpenAI.

GPT3, имя, которое вы должны запомнить

Что. GPT3 — это модель глубокого обучения, которая может генерировать текст, похожий на человеческий. Модель обучена прогнозировать следующий токен в последовательности и может генерировать беглый и реалистичный текст. Его возможности выходят за рамки текста, поскольку он также может обрабатывать генерацию кода. Его результаты настолько похожи на человеческие, что документ, представляющий GPT-3, предупреждает о потенциальных опасностях неправильного использования модели, оправдывая необходимость раскрывать ее только через API, что противоречит тенденции того времени открывать исходный код для всех моделей. Вскоре после своего выпуска GPT3 покорил мир, подпитывая очень большое количество приложений и стартапов.

Применения в реальной жизни: анализ и обобщение текста, копирайтинг, генерация кода и завершение, и это лишь некоторые из них. Через девять месяцев после запуска нашего первого коммерческого продукта OpenAI API более 300 приложений теперь используют GPT-3, и десятки тысяч разработчиков по всему миру работают на нашей платформе. В настоящее время мы генерируем в среднем 4,5 миллиарда слов в день и продолжаем масштабировать производственный трафик. ("источник").

Подробнее. Если вы используете онлайн-решение для копирайтинга, вероятно, внутри вы используете GPT3. Вы можете прочитать об этом подробнее и поиграть с моделью самостоятельно: https://beta.openai.com/playground. OpenAI предлагает кредиты в размере 18 $ для всех новых учетных записей.

CLIP, соединяющий текст и изображения

Что. Обученный на большом наборе изображений и описаний, Clip способен анализировать и описывать визуальные понятия в изображении. По словам самого OpenAI: Мы представляем нейронную сеть под названием CLIP, которая эффективно изучает визуальные концепции из наблюдения за естественным языком. CLIP можно применить к любому эталону визуальной классификации, просто указав имена визуальных категорий, которые необходимо распознать, аналогично возможностям «нулевого выстрела GPT-2 и GPT-3». ("источник")

Применения в реальной жизни: нулевая классификация изображений, описание изображений, модерация контента, создание изображений и т. д. Обратите внимание, что CLIP является одним из строительных блоков Dalle.

Подробнее: узнайте больше о клипе в блоге OpenAI: https://openai.com/blog/clip/

Dalle2, прекрасный художник

Что. С момента выпуска Dalle, а затем Dalle2, стала одной из самых популярных моделей генерации изображений на основе подсказок. Теперь он общедоступен либо напрямую через веб-сайт OpenAI, либо через его API (релиз в ноябре 2022 года!)

Применения в реальной жизни: иллюстрация, фотография как изображения, генерация NFT, редактирование изображений и т. д. Мы считаем, что его влияние столь же значительно, как и то, что мы наблюдали с GPT3. Microsoft уже объявила о том, что Dalle2 будет поддерживать приложение Designer; Shutterstock также объявил о партнерстве с OpenAI, чтобы пользователи могли использовать Dalle2 на своей платформе!

Подробнее: все, что вам нужно знать о dalle2: https://openai.com/dall-e-2/

Шепот, тот, кто все слышит

Что: в конце сентября 2022 г. Whisper представляет собой новую модель распознавания речи с открытым исходным кодом, которая быстрее и точнее предыдущих моделей: многоязычных и многозадачных контролируемых данных, собранных из Интернета». ("источник")

Применения в реальной жизни. Он также бесплатный и программируемый, что делает его сильным конкурентом существующих коммерческих служб распознавания речи. Разработчики, попробовавшие Whisper, в восторге от возможностей, которые он может предоставить. И это может создать проблемы для облачных сервисов ASR, которые до сих пор были основным вариантом. Мы полагаем, что благодаря небольшим моделям он будет стимулировать новые мобильные приложения, работающие локально, что позволит избежать проблем с конфиденциальностью, связанных с загрузкой данных в облако перед расшифровкой (см. пример твита, объявляющего о новой функции для журналистов: источник твита).

Подробнее: https://openai.com/blog/whisper/

Кодекс, который соединит все это

Что: «OpenAI Codex, система преобразования естественного языка в код на основе GPT-3, помогает преобразовывать инструкции [естественного языка] в более чем дюжину популярных языков кодирования. Codex был выпущен в августе прошлого года через наш API и является основным строительным блоком GitHub Copilot». Обратите внимание, что вы можете попросить GPT3 объяснить код простым текстом, и он сделает это, поэтому его способность понимать и генерировать код уже закодирована в GPT3. Однако Codex специализируется на создании исполняемого кода, что делает его отличным помощником разработчика. Поскольку он уже интегрирован в Visual Studio, по опыту его интеграция в ваш цикл разработки не вызывает затруднений.

Применения в реальной жизни. Многие приложения уже появились. Чтобы назвать несколько (выделенных самим OpenAI), а именно, второй пилот, пигма и повтор.

Copilot – это ваш помощник по программированию, способный завершить ваш код или сгенерировать его на основе ваших инструкций. Таким образом, он может преобразовывать комментарии в код, генерировать тесты и предлагать альтернативы.
Codex также позволяет Pygma преобразовывать проекты Figma в высококачественный код.
Replit использует Codex для описания того, что делает выбранный фрагмент кода, чтобы каждый мог понять его функциональность.

Подробнее: все подробности доступны здесь: https://openai.com/blog/codex-apps/

А вы?

Если бы вам пришлось выбрать одну инновацию в области искусственного интеллекта в прошлом году, которая вас очаровывает или, возможно, вы считаете, что она может изменить мир, каким мы его знаем, что бы вы выбрали??

Если вы дожили до этого места, значит, вы настоящий гик. В следующих постах я буду освещать современное состояние приложений ИИ и их эволюцию, так что, пожалуйста, подпишитесь, чтобы быть в курсе последних новостей ;)

Подпишитесь и присоединяйтесь к BoredGeekSociety.

Хорошего дня!

Если вам понравился этот пост, поддержите нас: 🔔 хлопатьи подписаться🔔

Обзор реальных приложений искусственного интеллекта — OpenAI Edition