Публикации по теме 'large-language-models'


Представляем DLite, облегченную модель, похожую на ChatGPT, на основе Dolly
DLite — это новая модель следования инструкциям, разработанная AI Squared путем точной настройки самой маленькой модели GPT-2 в наборе данных Alpaca. Несмотря на наличие всего 124 миллионов параметров, DLite демонстрирует впечатляющую интерактивность, подобную ChatGPT, и может быть настроен на одном графическом процессоре T4 менее чем за 15 долларов США. Из-за относительно небольшого размера DLite можно запускать локально в самых разных вычислительных средах, включая процессоры ноутбуков, и..

Более эффективное взаимодействие с компьютерами с помощью обработки естественного языка и большого языка…
Обработка естественного языка (NLP) — это область искусственного интеллекта, которая занимается взаимодействием между компьютерами и человеческим языком. Алгоритмы и модели НЛП используются для понимания, анализа и создания человеческого языка. Одной из ключевых проблем НЛП является понимание смысла текста. Это связано с тем, что значение текста может зависеть от контекста, в котором он используется, а также от тонкостей человеческого языка. Например, фраза Служба была не от мира..

Мы попросили gpt4 классифицировать финансовые данные.
В Ntropy мы помогаем компаниям понять своих клиентов на основе их финансовых данных. Информация, скрытая в банковских данных, ценна и может открыть доступ к новому поколению продуктов и услуг. Извлечение этой информации с точностью, близкой к человеческой, до недавнего времени было невозможно из-за достижений в моделях естественного языка. Подробнее об этом здесь . Обогащение финансовых данных — проблема, которая может показаться простой, но на самом деле ее довольно сложно решить...


Понимание Scikit-LLM
Использование LLM в качестве классификаторов черного ящика Мне было любопытно понять, как Scikit-LLM работает на практике. По словам автора репозитория, Scikit-LLM интегрирует мощные языковые модели, такие как ChatGPT, в Scikit-learn для расширенных задач анализа текста. Глядя на бэкэнд, кажется, что он просто оборачивает подсказки с нулевым выстрелом для классов с несколькими классами и несколькими метками. Разорвемся…

За миллионами: оценка масштаба больших языковых моделей
Обсуждение LLM, таких как ChatGPT, основных затрат и подходов к оптимизации логического вывода. Благодаря Реган Юэ вы можете прочитать китайскую версию этой статьи на mp.weixin.qq.com , juejin.cn , segmentfault.com и xie.infoq.cn . »! В недавнем прошлом машинное обучение считалось сложной нишевой технологией, которую могли понять лишь немногие избранные. Однако по мере того, как приложения машинного обучения становятся все более мощными, интерес общественности растет, что..

Понимание больших языковых моделей (LLM): история, механизмы и приложения
Модели больших языков, такие как BERT и GPT-3, произвели революцию в обработке естественного языка и распознавании речи, но как они работают, какова их история и будущее? В этой статье представлен всесторонний обзор больших языковых моделей, включая их историю, механизмы, приложения, этику, достижения и будущее. Введение Большие языковые модели — это компьютерные программы, обученные понимать и генерировать текст на естественном языке. В последние годы они становятся все более..