Этот информационный бюллетень AI - все, что вам нужно # 48

Что произошло на этой неделе в AI by Louie

На этой неделе в области искусственного интеллекта были сделаны важные заявления от OpenAI, а также усилилось давление на компанию, включая показания Сэма Альтмана в Сенате, выпуск приложения ChatGPT для iOS и плагинов для пользователей ChatGPT+.

Во время слушаний в сенатском комитете генеральный директор OpenAI Сэм Альтман вместе с другими лидерами отрасли в целом согласился с необходимостью регулирования быстро развивающейся технологии искусственного интеллекта, разработанной такими компаниями, как OpenAI, Google и Microsoft. Хотя мы согласны с необходимостью регулирования ИИ, им необходимо очень тщательно управлять и выполнять его, и одним из ключевых рисков, связанных с усилением регулирования, является его способность закрепить за лидерами рынка высокие регулятивные барьеры для конкуренции. По этой причине некоторые ставят под сомнение мотивы крупных технологических компаний, призывающих к регулированию ИИ. В противовес этому в своем Управлении сверхразумом OpenAI выступает за то, чтобы наиболее обременительные правила вступали в силу только при превышении значительного порога возможностей.

OpenAI также был занят новыми выпусками, включая кнопку «Продолжить генерацию» в ChatGPT, направленную на улучшение взаимодействия с пользователем. Эта функция устраняет необходимость вручную вводить «продолжить» для более длинных ответов и вводов, оптимизируя процесс. Кроме того, OpenAI недавно запустила официальное приложение ChatGPT для iOS и планирует вскоре выпустить версию для Android. Приложение для iOS является бесплатным для использования и включает функцию преобразования речи в текст, позволяющую пользователям взаимодействовать с ChatGPT с помощью речи. Кроме того, OpenAI представила плагины исключительно для подписчиков ChatGPT Plus, предоставив им доступ к просмотру веб-страниц и всем бета-плагинам. Эти бета-плагины предлагают широкий набор функций, включая преобразование текста в аудио и обновление данных в реальном времени об акциях и криптовалютах.

По мере того, как модели искусственного интеллекта с открытым исходным кодом набирают обороты, а споры о плюсах и минусах моделей открытого исходного кода и закрытых API для искусственного интеллекта продолжаются, OpenAI также объявила о предстоящем выпуске новой модели большого языка с открытым исходным кодом. Возможно, это происходит из-за возросшего давления со стороны мира LLM с открытым исходным кодом. Конкретные детали будущей модели OpenAI с открытым исходным кодом пока не разглашаются. Импульс ИИ с открытым исходным кодом также продолжился на Stability AI на этой неделе, что сделало его платформу DreamStudio с открытым исходным кодом. Модель Stable Diffusion, на которой он основан, с самого начала была с открытым исходным кодом, но интересно увидеть, как коммерческий интерфейс также становится открытым исходным кодом, и мы будем следить за этой тенденцией в более широком смысле.

– Луи Питерс, соучредитель и генеральный директор компании Towards AI

Горячие новости

Stability AI выпускает StableStudio в качестве последнего шага для искусственного интеллекта с открытым исходным кодом

Stability AI представляет версию DreamStudio с открытым исходным кодом, коммерческий интерфейс, разработанный для их модели генератора изображений AI под названием Stable Diffusion. Этот выпуск позволяет разработчикам сообщества улучшать интерфейс и экспериментировать с ним, что может привести к ценным улучшениям для компании.

2. Представляем приложение ChatGPT для iOS

ChatGPT запустил приложение для iOS, которое включает в себя распознавание речи с открытым исходным кодом для своих подписчиков. Приложение, доступное бесплатно, позволяет пользователям синхронизировать свою историю чатов на нескольких устройствах. Подписчики ChatGPT Plus получают эксклюзивный доступ к возможностям GPT-4, ранний доступ к функциям и более быстрое время отклика — и все это на iOS.

3. Meta делает большие ставки на искусственный интеллект со специальными чипами и суперкомпьютером

Meta сообщила о своих внутренних усилиях по разработке инфраструктуры рабочих нагрузок ИИ, уделяя особое внимание генеративному ИИ. Они представили новый чип под названием Meta Training and Inference Accelerator (MTIA). MTIA — это специализированная интегральная схема, которая объединяет различные схемы на одной плате, что позволяет программировать ее для параллельного выполнения одной или нескольких задач.

4. Apple представляет новые специальные возможности, такие как настраиваемые голоса для преобразования текста в речь

Apple анонсировала набор новых функций, направленных на повышение доступности когнитивных функций, зрения и речи. Эти инструменты планируется представить на устройствах iPhone, iPad и Mac в конце этого года. Вспомогательный доступ, специально разработанный для людей с когнитивными нарушениями, будет реализован в ряде продуктов Apple в следующем году.

5. Zoom скоро интегрирует чат-бота Anthropic на свою платформу

Zoom объявила о партнерстве с Anthropic, чтобы интегрировать помощника искусственного интеллекта последнего в свою платформу для повышения производительности. Первоначальная реализация этой интеграции будет включать в себя включение Клода в продукт Zoom Contact Center. Цель состоит в том, чтобы улучшить услуги поддержки клиентов, используя возможности Клода для разработки улучшенных функций самообслуживания.

5-минутные чтения/видео, чтобы вы продолжали учиться

Автооценка контекстного окна Anthropic 100k

Модель Клода со 100 тысячами токенов от Anthropic вызвала дискуссию о необходимости поиска документов в системах вопросов и ответов (Q&A). Архитектура без ретривера работает хорошо, но имеет более высокую задержку, чем подходы на основе ретривера, и больше всего подходит для небольших корпусов и приложений с некритической задержкой. Это обсуждение поднимает важные соображения относительно компромисса между подходами, основанными на поиске, и подходами, не использующими поиск, в системах вопросов и ответов.

2. Модель «трех холмов для оценки стартапов GPT»

Модель «Трех холмов» обеспечивает основу для оценки успеха стартапов GPT на основе трех ключевых факторов: «Повышение производительности», «Ценность игры с ненулевой суммой» и «Ров = ценность из контекста». Эти факторы оцениваются по трем различным уровням. Кроме того, модель определяет три категории рвов, которые могут помочь предотвратить общее смещение GPT.

3. ChatGPT против Bard: реалистичное сравнение

В статье проводится ненаучный полевой эксперимент по сравнению производительности ChatGPT и Bard. Автор подвергает обе модели различным испытаниям, включая обобщение длинного контента, создание функции Python, разработку тактики маркетинга в социальных сетях и многое другое.

4. Десятилетие в инженерии данных — что изменилось?

За десять лет в области инженерии данных появилось множество значительных прорывов и инструментов. Это сыграло ключевую роль в преобразовании методов работы инженеров по обработке данных. В этой статье представлен обзор истории инженерии данных с выделением ключевых вех, которые сформировали эту область и привели нас к нынешнему состоянию.

5. Что такое искусство ИИ и как оно создается?

В этой статье представлено всестороннее исследование концепции ИИ-искусства, его значение, исторический фон искусства, созданного ИИ, различные типы ИИ, используемые в создании произведений искусства, способы использования ИИ художниками, проблемы, связанные с созданием искусства ИИ, этические проблемы, связанные с искусством, созданным искусственным интеллектом, и многое другое.

Бумаги и репозитории

ray-project/llm-числа

В Google был документ, составленный Джеффом Дином, легендарным инженером, под названием «Числа, которые должен знать каждый инженер». Наличие аналогичного набора чисел для разработчиков LLM (Language Model) очень полезно для быстрой оценки. Этот репозиторий предназначен для обмена конкретными числами, используемыми Anyscale, с объяснением их значения и демонстрацией того, как их можно использовать в своих интересах.

2. CodeT5+: открытый код для больших языковых моделей

Представляем CodeT5+: набор кодировщиков-декодеров LLM, предназначенных для кода, позволяющих гибко комбинировать модульные компоненты для решения различных последующих задач кода. В анализе подчеркивается современная производительность моделей (SoTA) при выполнении различных задач, связанных с кодом, включая генерацию и завершение кода, математическое программирование и преобразование текста в код.

3. Древо мыслей: обдуманное решение проблем

В статье представлена инновационная структура для вывода языковых моделей под названием «Дерево мыслей» (ToT). ToT основан на подходе «Цепочка мыслей», обычно используемом для подсказки языковых моделей, но с дополнительной возможностью изучения связных единиц текста, называемых «мыслями». Эти мысли служат промежуточными шагами к решению проблемы.

4. mLongT5: многоязычный и эффективный преобразователь текста в текст для более длинных последовательностей

mLongT5 улучшает архитектуру LongT5 за счет использования многоязычных наборов данных, используемых при предварительном обучении mT5 и задачах предварительного обучения UL2. Модель прошла оценку по нескольким многоязычным задачам обобщения и ответов на вопросы, продемонстрировав более высокую производительность по сравнению с существующими многоязычными моделями, такими как mBART или M-BERT.

5. Улучшение согласования языковой модели с помощью самостоятельной игры и обучения в контексте с обратной связью ИИ

Это исследование исследует возможность использования различных моделей ИИ, взяв на себя роли покупателя, продавца и критика в переговорной игре, чтобы изучить и улучшить свои способности заключать сделки без вмешательства человека. Исследование показало, что определенные модели способны учиться на игре и совершенствовать свои стратегии ведения переговоров.

Понравились эти статьи и сводки новостей? Получайте ежедневный обзор на почту!

Раздел сообщества Learn AI Together!

Еженедельный подкаст об искусственном интеллекте

В выпуске подкаста Что такое ИИ на этой неделе Луи Бушар берет интервью у Дэвида Мерца, старшего разработчика, специалиста по данным и автора. Они погружаются в увлекательный мир генеративного ИИ и его приложений в кодировании, включая помощников по кодированию ИИ, таких как Copilot и ChatGPT. Обсуждение также затрагивает проблемы авторского права, связанные с генеративным ИИ, и углубляется в сложный вопрос моральных прав и атрибуции. Дэвид выделяет сильные и слабые стороны этих помощников, объясняя, как они могут как помогать, так и мешать разработчикам в их усилиях по кодированию. Вы можете найти подкаст на YouTube, Spotify или Apple Podcasts.

Мем недели!

Мем поделился NEON#8052

Избранный пост сообщества из Discord

Chris M#0847 недавно представил DataLab, реализацию Python с открытым исходным кодом, которую легко использовать для всех типов данных, включая изображения, текст, табличные данные и аудио. В Software 2.0 данные стали новым кодом, модели — новым компилятором, а ручная проверка данных — новым модульным тестом. Datalab сочетает любую модель ML с инновационными алгоритмами качества данных, чтобы предоставить линтер для стека Software 2.0. Он автоматически анализирует наборы данных на наличие ошибок, адаптивно проверяя проблемы, обычно встречающиеся в реальных наборах данных машинного обучения, не требуя от вас указания их потенциальной формы. Проверки Datalab учитывают всю соответствующую информацию, полученную вашей обученной моделью машинного обучения. Найдите его на GitHub или ознакомьтесь с руководством по Jupyter здесь и поддержите другого члена сообщества. Делитесь своими мыслями в теме здесь!

AI-опрос недели!

Присоединяйтесь к обсуждению в Discord.

TAI Кураторский раздел

Статья недели

Сравните ChatGPT с методами машинного обучения для анализа настроений в 2023 году от Courtlin Holt-Nguyen

Анализ настроений на основе НЛП (обработки естественного языка) позволяет системам ИИ понимать мнения и эмоции, выраженные в тексте. Расширенные возможности НЛП ChatGPT привлекли значительное внимание в последние месяцы. Однако остается вопрос: превосходит ли ChatGPT существующие методы машинного обучения НЛП? Эта статья призвана продемонстрировать значительно повышенную точность ChatGPT по сравнению с методами НЛП до ChatGPT.

Наши обязательные к прочтению статьи

Понимание LangChain 🦜️🔗: Часть: 2 от Chinmay Bhalerao

Создание бота для вопросов и ответов по личным документам с помощью OpenAI и LangChain, автор Sriram Parthasarathy

Если вы заинтересованы в публикации с помощью Towards AI, ознакомьтесь с нашими рекомендациями и зарегистрируйтесь. Мы опубликуем вашу работу в нашей сети, если она соответствует нашим редакционным политикам и стандартам.

Предложения о работе

Специалист по обработке данных @Hyperscience (удаленно)

Старший инженер-программист — Backend @Harness (Маунтин-Вью, США/гибрид)

Инженер по машинному обучению @ConverseNow.ai (Буэнос-Айрес, Аргентина/гибрид)

Старший инструктор по работе с данными ИИ @Cohere (удаленно)

Штатный инженер по машинному обучению @Clari (удаленно)

Старший инженер-программист (Python) @Reserv (удаленно)

Менеджер по разработке программного обеспечения @Lucidya (удаленно)

Хотите поделиться здесь вакансией? Обращайтесь по адресу [email protected].

Если вы готовитесь к следующему собеседованию по машинному обучению, обязательно посетите наш ведущий веб-сайт для подготовки к собеседованию, confetti!