Публикации по теме large-language-models

Публикации по теме 'large-language-models'

Вы больше не можете не понимать, как использовать большие языковые модели

Практический подход к изучению того, как работают большие языковые модели на практике. Почему нужна новая статья о больших языковых моделях? Запуск и невероятная скорость внедрения ChatGPT за последние несколько месяцев превратили этот чат-бот с искусственным интеллектом в настоящую общеизвестную тему. Любой, кто до сих пор не слышал о ChatGPT, сразу подозревается в отключении от реального мира на несколько месяцев — хотя интеллект этого чат-бота скорее искусственный, чем..

Взлом кода больших языковых моделей: чему меня научили блоки данных

Научитесь создавать собственные комплексные рабочие процессы LLM, готовые к производству. В мире, который все больше формируется искусственным интеллектом, модели большого языка (LLM) стали жемчужиной сферы машинного обучения. Эти чудеса технологии, способные генерировать текст, похожий на человеческий, и понимать тонкости языка, нашли применение в самых разных областях: от обработки естественного языка до генерации контента. Поскольку спрос на приложения на основе LLM стремительно..

Как добавить предметно-ориентированные знания в LLM на основе ваших данных

Превратите своего LLM в полевого эксперта Введение В последние месяцы модели больших языков (LLM) коренным образом изменили то, как мы работаем и взаимодействуем с технологиями, и зарекомендовали себя как полезные инструменты в различных областях, выступая в качестве помощников по написанию, генераторов кода и даже творческих сотрудников. Их способность понимать контекст, генерировать человекоподобный текст и выполнять широкий спектр языковых задач выдвинула их на передний план..

Открывая чудеса больших языковых моделей: как передовые технологии меняют общение.

Введение: Добро пожаловать, любознательные умы, в мир больших языковых моделей! В этой статье мы начинаем захватывающее приключение, чтобы раскрыть захватывающие чудеса, которые стали возможными благодаря искусственному интеллекту (ИИ), обработке естественного языка (НЛП) и машинному обучению (МО). Не беспокойтесь о сложно звучащих словах. мы объясним эти идеи в простой и увлекательной форме, чтобы каждый мог понять эту удивительную новую технологию. ИИ: ваш сверхинтеллектуальный..

Переосмысление атрибуции контента для ИИ: большие языковые модели и их влияние на авторов

Stack Overflow уже много лет является незаменимым ресурсом для разработчиков программного обеспечения. Однако недавние достижения в области искусственного интеллекта, особенно в моделях больших языков (LLM), привели к значительному падению его трафика — примерно на 50 % за последние полтора года.* LLM были обучены с данными SO, полезность и влияние SO преумножились , но теперь трафик фиксируется в другом месте. Мы не так уж далеки от будущего, в котором вы будете разговаривать с..

Ускорение обучения LLM с помощью конвейерного параллелизма с балансировкой памяти

При конвейерном параллелизме графические процессоры согласовываются с определенными этапами конвейера, каждый из которых отвечает за подмножество уровней модели. Соответственно, между этапами конвейера существуют зависимости данных, требующие поступления необходимых данных либо для прямого, либо для обратного вычисления. Чтобы не допустить простоя графических процессоров, входной пакет делится на микропакеты и обрабатывается конвейерным способом, как показано на рисунке выше. Один..

Внедрение генеративного агента с локальным LLM, руководством и Langchain

После успешного создания ReAct агента с гидом я продолжаю делать более сложную вещь — Генеративного агента . Это исследование было опубликовано командой Стэнфорда и Google на Arxiv 7 апреля 2023 года. Они пытаются создать небольшую деревню, полную генеративных агентов. Генеративные агенты контролируются LLM (например, ChatGPT). Это The Sims , где NPC могут вести себя как люди. Используя LLM, агенты могут думать, составлять план и принимать решения, а также взаимодействовать с..