Публикации по теме 'nlp'


Объяснение GPT-3
Понимание самоконтролируемых архитектур на основе трансформаторов В этой статье мы будем обсуждать известную модель GPT-3, предложенную в статье OpenAI Языковые модели - немногие изучающие . Это преемник GPT-2 , имеющий архитектуру, очень похожую на GPT-3. Если вы не знаете о GPT-2, подумайте о том, чтобы прочитать мою статью о GPT-2 , поскольку большая часть GPT-3 основана на нем и поможет лучше понять модель. Краткое резюме Возвращаясь к GPT-2, это, по сути, модель..

Существует множество библиотек NLP, например, Natural Language Toolkit (NLTK), TextBlob, CoreNLP, Gensim и spaCy. Также есть множество…
Существует множество библиотек NLP, например Natural Language Toolkit (NLTK), TextBlob , CoreNLP , Gensim и spaCy . Также есть большое количество обобщенных текстов — покажу просто, в трех предложениях без NLP. Понадобятся для предварительной обработки и сортировки самых библиотек данных. Библиотеки import re import heapq Будем обобщать текстовый блок, который содержит 600 слов: Исключим стоп-слова языка. Стоп-слова нужного языка можно получить с сайта Countwordsfree:..

Обучите машину писать вашу статью
Часть 2 Думайте как специалист по данным! Как создать инструмент НЛП, который может писать за вас блог Medium? Эта история является продолжением Части-1 , в которой мы прошли введение, построение набора данных и анализ данных статей среднего размера. Думайте как специалист по данным! Как сделать инструмент НЛП для написания блога на Medium для вас? Устранение разрыва между ученым-исследователем данных и специалистом по данным из реального мира..

Прогнозирование эмодзи с использованием вложений времени
Использование эмодзи стало новой формой социального общения, что важно, поскольку оно может помочь улучшить системы общения, такие как приложения чата. В этой статье исследуется использование и семантика смайликов с течением времени для анализа сезонных колебаний использования смайлов. Кроме того, авторы разрабатывают модель прогнозирования эмодзи на основе информации о времени. Вклад В прошлом проводились многочисленные исследования предсказаний смайликов (см. Известную..

Как создать API NLU с открытым исходным кодом с помощью Rasa
Как создать API NLU с открытым исходным кодом с помощью Rasa У вас есть доступ к исключительному инструменту понимания естественного языка Вступление Существует много ажиотажа в отношении чат-ботов и разговорного ИИ в целом. Технологии часто сравнивают друг с другом, чтобы найти наиболее подходящие для конкретной организации или задачи. Проблема в том, что со всеми доступными технологиями легко принимать первоначальные решения. Последующие дизайнерские и архитектурные..

Как использовать предварительно обученные векторы слов из fastText от Facebook
Что такое fastText ? fastText - это библиотека для эффективного изучения представлений слов и классификации предложений. На простом английском языке, используя fastText, вы можете создавать собственные вложения слов с помощью Skipgram, word2vec или CBOW (Continuous Bag of Words) и использовать их для классификации текста. Facebook опубликовал предварительно обученные векторы слов, почему это важно? Причина, по которой я пишу этот пост, - с легкостью использовать слово векторы,..

Боевики и драмы: чем отличаются сценарии?
Анализ различий между боевиками и драмами с использованием Python и Natural Language Toolkit (NLTK) Мне нравятся фильмы, и я хочу узнать больше об обработке естественного языка, поэтому мне показалось, что это идеальный вариант для их объединения. Я решил провести базовый анализ различий между двумя жанрами фильмов - боевиками и драмами, используя Python и Набор инструментов для естественного языка (NLTK). Цель состояла в том, чтобы лучше познакомиться с NLTK, токенизацией слов,..