Публикации по теме 'word-cloud'


Облако слов
Сначала мы знаем об облаке слов - В текстовой аналитике облако слов широко используется для более интерактивного представления вашего текста. Его можно использовать для представления наиболее часто встречающихся, менее частых слов и т. Д. В текстовых данных. В этом документе мы обсуждаем Word Cloud и способы его реализации. Итак, чтобы понять это, мы сначала разберемся с некоторыми терминами. Вот они: Анализ текста : Анализ текста используется для выполнения операций с..

Как создать облако Word на Python подвиг. Stylecloud
Этот пост включает в себя всестороннее изучение того, как создать облако слов на Python. Так что, даже если вы новичок, не беспокойтесь, просто продолжайте. Мы начнем с создания простого wordcloud с помощью библиотеки wordcloud, и в конце этого урока вы сможете создать завораживающее stylecloud , подобное показанному ниже, не обращая внимания на препятствия. Давайте начнем! Что такое Wordcloud? Облако слов - это набор слов, где размер каждого слова представляет его частоту в..

Мы теряем 24% клиентов каждый год, придумайте как минимум 5 гипотез и подтвердите их.
Вопрос интервью по науке о данных в BLUE APRON (это набор предметов первой необходимости для еды, который компания работает по модели подписки) Итак, прежде чем перейти к решению, давайте разберемся, как работает эта компания или какова точная бизнес-модель. Теперь вот первый совет: знание предметной области одинаково важно в машинном обучении, таком как алгоритмы, кодирование, математика. Без точного знания предметной области невозможно построить модель, способную решить проблему..

Вопросы по теме 'word-cloud'

Как создать облако слов из корпуса в Python?
Из Создание подмножества слов из корпуса в R , отвечающий может легко преобразовать term-document matrix в облако слов. Есть ли аналогичная функция из библиотек Python, которая принимает либо текстовый файл необработанного слова, либо NLTK...
99276 просмотров
schedule 25.05.2022

Столкновение с Word Cloud Generator (D3.JS)
Я пытаюсь использовать World Cloud Generator: http://www.jasondavies.com/wordcloud/about/ , который является надстройкой для использования с D3.JS. Вот мой код: var fill = d3.scale.category20(); function draw(words) {...
2156 просмотров

Обновить слова (изменить размер или удалить слова) в облаке слов D3 без изменения их положения?
Я использую библиотеку облака слов в D3 Джейсона Дэвиса. Это обычный код, который я использую, и он отлично подходит для создания словесных облаков. d3.layout.cloud().size([width, height]) .words(d3.zip(vis_words,...
2904 просмотров

Создание облака слов фраз, а не отдельных слов в R
Я пытаюсь сделать облако слов из списка фраз, многие из которых повторяются, а не из отдельных слов. Мои данные выглядят примерно так: один столбец моего фрейма данных представляет собой список фраз. df$names <- c("John", "John", "Joseph A",...
10013 просмотров
schedule 15.06.2022

Wordcloud с wordcloud2.js
Мне нужно создать облако слов для моего сайта! Я нашел инструмент javascript с именем wordcloud2.js, который выполняет то, что я хочу, но... Я обнаружил, что .js не отображает все слова, которые я передаю в скрипт в массиве arr6. Кто-нибудь...
2038 просмотров

Создание WordCloud из нескольких наборов текста
На основе этого вопроса Как создать облако слов из корпуса на Python? , я построил облако слов, используя библиотеку amueller . Однако я не понимаю, как я могу накормить облако более чем одним текстовым набором. Вот что я пробовал до сих пор:...
2144 просмотров
schedule 18.11.2022

Облако слов для других языков
Я использую JasonDavies's Word Cloud для своего проекта, но есть проблема, что я использую персидский [фарси] Строки и моя проблема здесь в том, что слова перекрываются в Svg. Это результат моего проекта: Что случилось со словами на...
1210 просмотров
schedule 30.12.2022

Интеллектуальный анализ китайского текста
Я использовал сегмент китайского слова для анализа текста. И я изменил тип данных на dataframe с запятой и двойной кавычкой. Итак, облако слов странное. Вот так: Мой синтаксис, как показано ниже: inspect(d.corpus) d.corpus <-...
1157 просмотров
schedule 05.10.2022

Uncaught TypeError: невозможно прочитать свойство marktype неопределенного значения в vega.js
Я написал облако слов, используя vega.js для работы со словами с частотой. Набор слов выглядит так перед добавлением в спецификацию: [{"текст":"действительно","значение":40},{"текст":"люди","значение":10}] Но когда он добавляется к...
935 просмотров
schedule 26.06.2022

Облака слов с абсолютными размерами слов
Я пытаюсь создать несколько облаков слов для сравнения терминов, которые сами по себе вложены в группы. Я хотел бы сделать одно облако слов на группу. Пакет wordcloud в R может создавать нужные мне облака слов, но каждое новое облако слов имеет...
523 просмотров
schedule 04.05.2024

WordCloud из фрейма данных с частотой python
у меня есть кадр данных, как показано ниже Int64Index: 14830 entries, 25791 to 10668 Data columns (total 2 columns): word 14830 non-null object coef 14830 non-null float64 dtypes: float64(1), object(1) я пытаюсь создать облако слов с...
27180 просмотров
schedule 23.12.2022

Как добавить в пакет wordcloud R больше слов, которые можно исключить из вывода?
Я использую пакет «wordcloud» с описанием «Word Cloud» из репозитория пакетов R. Когда я создаю облако слов из случайного текста, некоторые слова автоматически пропускаются, поскольку они не должны быть частью облака слов. Теперь я хочу добавить в...
217 просмотров
schedule 06.08.2022

Как распечатать модель темы lda и облако слов каждой из тем
from nltk.tokenize import RegexpTokenizer from stop_words import get_stop_words from gensim import corpora, models import gensim import os from os import path from time import sleep import matplotlib.pyplot as plt import random from wordcloud import...
9143 просмотров
schedule 02.08.2022

Сделать все слова прописными в Wordcloud в R
При создании Wordclouds чаще всего все слова пишутся в нижнем регистре. Однако я хочу, чтобы облака слов отображали слова в верхнем регистре. После принудительного перевода слов в верхний регистр словооблако по-прежнему отображает слова в нижнем...
1131 просмотров
schedule 23.10.2022

Wordcloud Python с generate_from_frequencies
Я пытаюсь создать облако слов из файла csv. Файл csv, например, имеет следующую структуру: a,1 b,2 c,4 j,20 В нем больше строк, более или менее 1800. В первом столбце есть строковые значения (имена), а во втором столбце - их соответствующая...
27099 просмотров
schedule 24.01.2024

Как создать облако слов из файла CSV с частотами слов
У меня есть файл CSV с данными в следующем формате column1 column2 hello 1 film 9 chicken 20 etc etc Как я могу создать облако слов, используя такой файл с помощью python? Я пытался использовать пакет wordcloud Андреаса...
1951 просмотров
schedule 12.12.2022

Блестящий вывод wordcloud2 создает дополнительный виджет
Используя пример rshiny на странице крана wordcloud2 ( https://cran.r-project.org/web/packages/wordcloud2/vignettes/wordcloud.html ), я получаю небольшое дополнительное поле под wordcloud. Это происходит всякий раз, когда я использую функциональность...
2151 просмотров
schedule 15.03.2023

Индивидуальное облако слов двух разных цветов в R
Я пытаюсь создать облако слов в R, в котором у меня есть матрица с положительными и отрицательными словами, однако я хочу показать положительные и отрицательные слова двумя разными цветами (скажем, зеленым и красным). Может кто-нибудь, пожалуйста,...
2308 просмотров
schedule 13.11.2022

R wordcloud2 letterCloud показывает только фон
Моя версия Rstudio 3.4.1 64-битная на Win10. Я установил пакет wordcloud2 с помощью команд install.packages('devtools') devtools::install_github("lchiffon/wordcloud2") И дело пошло на лад. Затем я попытался запустить пример из официальной...
5963 просмотров
schedule 09.11.2022

Новая ошибка выдается с пакетом tm и dtm/wordclouds
с использованием R (3.2.5) и со следующими загруженными пакетами «SnowballC», «tm», «NLP», «RWeka», «RTextTools», «wordcloud», «fpc» carmenCorpus <- Corpus(VectorSource(feedback$Description)) carmenCorpus <- tm_map(carmenCorpus,...
296 просмотров
schedule 25.06.2022