Публикации по теме 'topic-modeling'


Как передискретизация ключевых слов может помочь в анализе текста
(Похожие сообщения: Введение в тематические модели для анализа текста , Понимание тематических моделей , Преодоление ограничений тематических моделей с полууправляемым подходом , Интерпретация и проверка тематических моделей и Являются ли тематические модели надежными или полезными? ) Как я объяснял в серии предыдущих сообщений в этом блоге, тематические модели — это захватывающий тип алгоритма, который предлагает исследователям возможность быстро идентифицировать (и,..

Тематическое моделирование: искусство рассказывания историй в НЛП
Тематическое моделирование — это неконтролируемый подход к обнаружению латентной (скрытой) семантической структуры текстовых данных (часто называемых документами). Почему тематическое моделирование? Каждый документ построен с иерархией, от слов до предложений, от абзацев до документов. Таким образом, извлечение тем из документов помогает нам анализировать наши данные и, следовательно, приносит больше пользы для нашего бизнеса. Разве не здорово иметь какой-то алгоритм,..

Интерпретация и проверка тематических моделей
(Похожие сообщения: Введение в тематические модели для анализа текста , Осмысление тематических моделей , Преодоление ограничений тематических моделей с помощью полууправляемого подхода , Как передискретизация ключевых слов может помочь при анализе текста и Насколько надежны или полезны тематические модели? ) Моя предыдущая публикация в этой серии показала, как подход к моделированию тем с полууправлением может позволить исследователям вручную уточнять модели тем для..

На пути к идеальному сообщению в блоге
Прогнозирование популярности постов на основе почти 10 000 статей Towards Data Science. Вдохновение Писать трудно; общаться сложнее. По мере того, как я перехожу от научных кругов к науке о данных, мой нынешний стиль общения нуждается в доработке. Погружаясь в мир прикладного и теоретического, краткость приобретает новое значение, равно как и синтез проектов в четкие, действенные идеи. Когда я начал это путешествие, «На пути к науке о данных» был частым ресурсом из-за качества..

BeautyExtract: информационный продукт для предоставления индивидуальных рекомендаций по уходу за кожей
Предыстория: во время стажировки в Insight Data Science я взялась за консультационный проект по работе со стартапом по уходу за кожей под названием Proven . Соучредители Proven обнаружили, что 55% людей сожалеют о покупках обычных средств ухода за кожей. Поэтому им пришла в голову идея предоставить индивидуальные схемы ухода за кожей, чтобы восполнить пробел. Цель The Project: Proven - создать индивидуальные формулы, ориентированные на различные проблемы с кожей. Им нужна..

8 ограничений алгоритмов тематического моделирования для краткого текста
Проблемы тематического моделирования в микроблогах Краткий текст обычно создается пользователем из-за отсутствия структуры, наличия шума и отсутствия контекста, что затрудняет моделирование машинного обучения. Тематическое моделирование направлено на выявление закономерностей в корпусе текста и извлечение основных тем, сущностей или тем в зависимости от того, как они упоминаются в конкретной модели. Тематическое моделирование, как известно, сложнее, чем текст короче. Например,..

Тематическое моделирование для начинающих
Как начать свой первый проект по тематическому моделированию! Покажи код Так что недавно я прошел путь от нуля до героя с моим первым проектом по моделированию темы. Моя тематическая модель отнюдь не была идеальной. Но, эй, с самого начала, не имея представления о том, что моделирование темы вообще имело в виду, это определенно скромное достижение недели, хорошо? Я подумал, что было бы замечательно объяснить, как я это сделал, вместе с несколькими советами и приемами, которые я..