Публикации по теме 'lda'
Тематическое моделирование LDA
Фон
Тематическое моделирование - это процесс определения тем в наборе документов. Это может быть полезно для поисковых систем, автоматизации обслуживания клиентов и в любом другом случае, когда важно знать тематику документов. Есть несколько способов сделать это, но здесь я объясню один: Скрытое распределение Дирихле (LDA).
Алгоритм
LDA - это форма обучения без учителя, которая рассматривает документы как мешки слов (т. Е. Порядок не имеет значения). LDA сначала делает ключевое..
Короче говоря, тематическое моделирование - это метод интеллектуального анализа текста для обнаружения тем в документах. Тема содержит группу слов, которые…
Короче говоря, тематическое моделирование - это метод интеллектуального анализа текста для обнаружения тем в документах. Тема содержит группу слов, которые часто встречаются вместе, и моделирование темы может соединять слова, которые имеют похожие значения, и может различать использование слов с несколькими значениями. Учитывая, что текстовые документы состоят из слов, тема, охватываемая более чем одним документом, может быть выражена комбинацией сильно связанных слов, и любой данный..
NLU: тема открытия
Мы исследуем два разных подхода к автоматическому обнаружению тем без учителя: тематическое моделирование с помощью скрытого анализа направления (LDA ) и текстовая кластеризация .
Допустим, мы хотим знать основные темы, затрагивающие вступительные титры к каждому эпизоду «Звездных войн».
Есть ли способ у машины прочитать и обобщить нам основные темы и концепции?
Предположим, они затрагивают несколько тем.
n_topics = 7
LDA
Мы можем использовать вероятностные..
Как они читают ваши мысли ?
ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА (ЧАСТЬ III)
Нижеследующее является частью серии статей по НЛП. (Отметьте Часть I и Часть II )
Вы когда-нибудь задумывались, как Spotify Discover Weekly может каждую неделю предоставлять вам настраиваемый плейлист, который соответствует вашим вкусам? Вы когда-нибудь искали видео и находили именно то, что искали, в списке рекомендуемых видео на YouTube? Разве не впечатляет то, что ваш любимый новостной веб-сайт предоставляет вам статьи, которые вас..
LDA (скрытая ассоциация Дирихле) для не статистиков.
Это сложно понять с самого начала. Я нашел хороший источник для изучения, и здесь я перевожу его в более простую версию истории.
Вы сможете лучше понять мою статью только после того, как потеряетесь в математике статей LDA. Я намеренно не буду использовать какую-то одну формулу.
А теперь забудьте о приведенном ниже графическом описании. График можно прочитать только после того, как вы полностью поймете историю LDA.
Итак, перейдем к истории.
LDA - это модельный подход. В..
Автоматическая маркировка тем в 2018 году: история и тенденции
В этом посте обсуждаются недостатки представления каждой темы в тематическом моделировании и различные подходы к их устранению.
Оглавление:
Введение Mei et al. 2007 Magatti et al. 2009 Лау и др. 2010 Лау и др. 2011 Мао и др. 2012 Hulpus et al. 2013 Aletras and Stevenson 2013 Мехдад и др. 2013 Кано и др. 2014 Bhatia et al. 2016 Другие подходы Ссылки
Введение
Тематическое моделирование было популярным..
Повышенная точность и меньшее время обработки при классификации текста с помощью LDA и TF-IDF
Реализация методов выбора признаков при классификации текста
Размер переменных или функций называется размерностью набора данных. В методах классификации текста размер объектов можно перечислить в большом количестве. В этом посте мы собираемся реализовать технику уменьшения размерности декомпозиции tf-idf с использованием линейного дискриминантного анализа-LDA.
Наш путь в этом исследовании:
1. Подготовка набора данных
2. Преобразование текста в векторные признаки
3. Применение..