Публикации по теме large-language-models

Публикации по теме 'large-language-models'

Понимание больших языковых моделей (LLM): история, механизмы и приложения

Модели больших языков, такие как BERT и GPT-3, произвели революцию в обработке естественного языка и распознавании речи, но как они работают, какова их история и будущее? В этой статье представлен всесторонний обзор больших языковых моделей, включая их историю, механизмы, приложения, этику, достижения и будущее. Введение Большие языковые модели — это компьютерные программы, обученные понимать и генерировать текст на естественном языке. В последние годы они становятся все более..

Очень нежное введение в большие языковые модели без шумихи

[Работа в процессе] 1. Введение Эта статья предназначена для того, чтобы дать людям, не имеющим знаний в области информатики, некоторое представление о том, как работают ChatGPT и аналогичные системы искусственного интеллекта (GPT-3, GPT-4, Bing Chat, Bard и т. д.). ChatGPT – это чат-бот, построенный на базе искусственного интеллекта для разговоров, но на основе большой языковой модели . Это определенно слова, и мы сломаем все это. В процессе мы обсудим основные концепции, лежащие в..

Ставка на возможности ИИ с JY Koh

Я заключаю пари с моим коллегой по работе JY о том, пройдет ли статья, полностью написанная с помощью модели машинного обучения, рецензирование. Я настроен скептически, он оптимистичен. Спор До 12:00 по Гринвичу 1 июля 2024 года статья, полностью написанная с использованием языка и/или модели изображения, будет принята на рецензируемую конференцию A-уровня по компьютерным наукам или в журнал Q1 по математике, статистике, или информатики. Предсказатель: JY Koh, Претендент: Бен..

Структурирование проектов и управление конфигурацией для приложений на базе LLM.

Можно сказать, что это часть 1.5 😅 моей мини-серии Создание комплексных приложений на базе LLM без API Open AI. Прежде чем идти дальше, если вам интересно, что охватывает часть 1, проверьте это. Мы расскажем, как интегрировать пользовательский LLM с помощью langchain. О чем пока идет речь в сериале Интеграция пользовательского LLM с использованием langchain (пример GPT4ALL) Управление конфигурацией приложений на базе LLM Подключение LLM к базе знаний (скоро)..

LoRA: низкоранговая адаптация с нуля — Код и теория

Модели-трансформеры могут иметь множество параметров, что может сделать их точную настройку дорогостоящей и трудоемкой задачей, что иногда даже невозможно на потребительском оборудовании из-за нехватки памяти. Адаптация низкого ранга (LoRA) весов линейной проекции может помочь решить эти проблемы за счет уменьшения количества параметров в модели, которые необходимо обновить в процессе тонкой настройки. Чтобы лучше понять, как это работает, давайте сначала наметим шаги, связанные с..

ИИ здесь. Как мы с ними разговариваем?

Есть много разных способов поговорить с AI LLM. Лучший метод для вас будет зависеть от задачи, которую вы пытаетесь выполнить, и ваших личных предпочтений. Следуя этим советам, вы сможете получить максимальную пользу от общения с AI LLM и узнать больше о том, как они работают. AI LLM, или большие языковые модели, представляют собой тип искусственного интеллекта, который может генерировать текст человеческого качества. Они обучены на огромных наборах данных текста и кода и могут..

Базовая модель медицинского искусственного интеллекта

Представляем PLIP, базовую модель патологии Введение Продолжающаяся революция искусственного интеллекта приносит нам инновации во всех направлениях. Модели OpenAI GPT лидируют в разработке и показывают, насколько базовые модели могут на самом деле облегчить некоторые из наших повседневных задач. От помощи нам в написании статей до оптимизации некоторых наших задач — каждый день мы видим анонсы новых моделей. Перед нами открывается много возможностей. Продукты искусственного..