Публикации по теме 'nlp'
Объяснение GPT-3
Понимание самоконтролируемых архитектур на основе трансформаторов
В этой статье мы будем обсуждать известную модель GPT-3, предложенную в статье OpenAI Языковые модели - немногие изучающие . Это преемник GPT-2 , имеющий архитектуру, очень похожую на GPT-3.
Если вы не знаете о GPT-2, подумайте о том, чтобы прочитать мою статью о GPT-2 , поскольку большая часть GPT-3 основана на нем и поможет лучше понять модель.
Краткое резюме
Возвращаясь к GPT-2, это, по сути, модель..
Существует множество библиотек NLP, например, Natural Language Toolkit (NLTK), TextBlob, CoreNLP, Gensim и spaCy. Также есть множество…
Существует множество библиотек NLP, например Natural Language Toolkit (NLTK), TextBlob , CoreNLP , Gensim и spaCy . Также есть большое количество обобщенных текстов — покажу просто, в трех предложениях без NLP. Понадобятся для предварительной обработки и сортировки самых библиотек данных.
Библиотеки
import re
import heapq
Будем обобщать текстовый блок, который содержит 600 слов:
Исключим стоп-слова языка. Стоп-слова нужного языка можно получить с сайта Countwordsfree:..
Обучите машину писать вашу статью
Часть 2 Думайте как специалист по данным! Как создать инструмент НЛП, который может писать за вас блог Medium?
Эта история является продолжением Части-1 , в которой мы прошли введение, построение набора данных и анализ данных статей среднего размера.
Думайте как специалист по данным! Как сделать инструмент НЛП для написания блога на Medium для вас? Устранение разрыва между ученым-исследователем данных и специалистом по данным из реального мира..
Прогнозирование эмодзи с использованием вложений времени
Использование эмодзи стало новой формой социального общения, что важно, поскольку оно может помочь улучшить системы общения, такие как приложения чата. В этой статье исследуется использование и семантика смайликов с течением времени для анализа сезонных колебаний использования смайлов. Кроме того, авторы разрабатывают модель прогнозирования эмодзи на основе информации о времени.
Вклад
В прошлом проводились многочисленные исследования предсказаний смайликов (см. Известную..
Как создать API NLU с открытым исходным кодом с помощью Rasa
Как создать API NLU с открытым исходным кодом с помощью Rasa
У вас есть доступ к исключительному инструменту понимания естественного языка
Вступление
Существует много ажиотажа в отношении чат-ботов и разговорного ИИ в целом.
Технологии часто сравнивают друг с другом, чтобы найти наиболее подходящие для конкретной организации или задачи.
Проблема в том, что со всеми доступными технологиями легко принимать первоначальные решения.
Последующие дизайнерские и архитектурные..
Как использовать предварительно обученные векторы слов из fastText от Facebook
Что такое fastText ?
fastText - это библиотека для эффективного изучения представлений слов и классификации предложений.
На простом английском языке, используя fastText, вы можете создавать собственные вложения слов с помощью Skipgram, word2vec или CBOW (Continuous Bag of Words) и использовать их для классификации текста.
Facebook опубликовал предварительно обученные векторы слов, почему это важно?
Причина, по которой я пишу этот пост, - с легкостью использовать слово векторы,..
Боевики и драмы: чем отличаются сценарии?
Анализ различий между боевиками и драмами с использованием Python и Natural Language Toolkit (NLTK)
Мне нравятся фильмы, и я хочу узнать больше об обработке естественного языка, поэтому мне показалось, что это идеальный вариант для их объединения.
Я решил провести базовый анализ различий между двумя жанрами фильмов - боевиками и драмами, используя Python и Набор инструментов для естественного языка (NLTK). Цель состояла в том, чтобы лучше познакомиться с NLTK, токенизацией слов,..