Публикации по теме 'nlp'


Руководство по OpenAI GPT-2 и как использовать его в Python
Узнайте, как создать собственный текстовый генератор, используя самую передовую в мире платформу НЛП! «Лучшие экономики мира напрямую связаны с культурой поощрения и положительной обратной связи». Вы можете догадаться, кто это сказал? Это не был президент или премьер-министр. Это определенно не был ведущий экономист, как Рагурам Раджан. Все из догадок? Эта цитата была создана машиной! Совершенно верно - модель Обработка естественного языка (NLP) , обученная на платформе..

Классификация турецких текстов: быстрый, простой и наивный подход.
Классификация текста — это задача, в которой используется машинное обучение для классификации предложений без участия человека. В этой работе я пытаюсь выполнить задачу быстрой классификации текста в наборе данных на турецком языке. Набор данных был огромным, поэтому мой компьютер не мог его обработать, поэтому я взял только 40 тыс. строк. Это сделало мои коды быстрее. Набор данных состоит из жалоб и их классов, я не могу доказать, но они должны быть взяты с..

Представляем TLDR, API для обобщения и анализа текста.
Как вы можете использовать этот мощный API для анализа статей в Интернете. В век информации огромное количество информации всегда под рукой. Интернет настолько велик, что фактически оценить его размер - сложная задача. Когда дело доходит до информации, наша проблема заключается не в ее отсутствии, а в том, чтобы разобраться в огромном количестве доступной нам информации. Что, если бы вы могли автоматически просматривать сотни веб-страниц и собирать наиболее важные моменты и ключевые..

Расстояние Левенштейна для чайников
Недавно я изучал НЛП, чтобы улучшить свои знания в области компьютерных наук. Я читаю об этом шаг за шагом и застреваю в штуке под названием «Расстояние Левенштейна». Я знаю, что такое расстояние Левенштейна, но не понимаю, как оно работает. Теперь, когда меня просветили многие уроки, я попытаюсь написать это человеческими словами. Прежде всего, я дам вам определение и применение расстояния Левенштейна. Расстояние Левенштейна — это строковая метрика для измерения разницы..

Что и почему вложения?
Выучить новый язык непросто, правда? Идея изучения нового языка почти всегда доставляет боль. В то же время я не могу ожидать, что мой ноутбук так легко выучит то, что я говорю. Все, что мы можем сделать, - это заставить наши компьютеры научиться устанавливать определенные отношения между словами, которые мы говорим. «Вы должны знать слово по компании, которую оно составляет» - Дж. Р. Ферт Зачем вообще нужны вложения? Возьмите этот небольшой разговор, в котором я пытаюсь научить..

Уроки, извлеченные из создания приложения для написания искусственного интеллекта [Руководство, с открытым исходным кодом]
writeup.ai - текстовый бот с открытым кодом, который пишет вместе с вами. Он (в основном) работает на OpenAI GPT-2 и имеет дополнительные отлаженные модели: Юридический Копирайтинг и заявления о миссии Текст песни Гарри Поттер Игра престолов Рефераты академических исследований Основные технические проблемы заключались в создании приложения, которое могло бы предоставить среду OpenAI GPT-2 (модель ML, генерирующую текст) быстро и одновременно для поддержки 10–20..

Обзор моделей на основе BERT
Также: некоторые недавние подсказки / идеи о том, что делает BERT таким эффективным. Внимание - простая идея сосредоточить внимание на основных частях ввода путем их средневзвешенного значения оказалась ключевым фактором в широком классе моделей нейронных сетей. Многоголовое внимание, в частности, оказалось причиной успеха современных моделей обработки естественного языка, таких как модели машинного перевода на основе BERT и Transformer. Многоголовое внимание, которое, по сути,..