Публикации по теме 'lda'


Что делает новости?
С появлением смартфонов и социальных сетей новости доступны практически мгновенно на любой платформе и устройстве. Огромное количество новых источников информации оказало значительное негативное влияние на традиционные средства массовой информации; Pew Research Center отмечает, что количество рабочих мест в новостных агентствах сократилось на 25% с 2008 года . Имея это в виду, я хотел изучить, о чем пишут основные средства массовой информации. Все ли они пишут на одни и те же темы?..

Линейный дискриминантный анализ (LDA): раскрытие возможностей классификации с уменьшением размерности
Методы уменьшения размерности необходимы для извлечения ценной информации из многомерных наборов данных в машинном обучении. Среди них выделяется линейный дискриминантный анализ (LDA) как уникальный подход, сочетающий снижение размерности с классификацией. Хотя на первый взгляд LDA может напоминать анализ главных компонентов (PCA), он предлагает явные преимущества и результаты. В этой статье мы углубимся в тонкости LDA и продемонстрируем его эффективность с помощью задачи классификации..

Освоение машинного обучения: изучение набора данных IRIS для прогнозного анализа
Вводный курс для энтузиастов машинного обучения Начало пути к машинному обучению может быть как захватывающим, так и ошеломляющим, особенно когда вы сталкиваетесь с новым инструментом или языком программирования. Тем не менее, начав с небольшого проекта, вы сможете заложить прочную основу для понимания основ. В этом руководстве мы погрузимся в мир машинного обучения, решая классическую задачу классификации цветов ириса с помощью R. Набор данных ириса предлагает идеальную отправную..

Тематическое моделирование со скрытыми распределениями Дирихле (LDA)
Тематическое моделирование с помощью Python Этот блокнот является адаптацией учебника , созданного Пиком Фоссеном. Что такое тематическое моделирование? Следующее изображение взято из Блей, 2021 Представьте себе, что вы заходите в книжный магазин, чтобы купить кулинарную книгу, и не можете найти часть магазина, где находится книга, предполагая, что книжный магазин только что собрал все типы книг вместе. В этом случае становится очевидной важность разделения книжного магазина..

Маркировка и классификация тем авиакомпаний: использование скрытого распределения Дирихле (LDA)
Пошаговое руководство по маркировке и классификации тем с использованием методов машинного обучения. Обозначение тем для авиакомпаний - мой заключительный проект в 12-недельной интенсивной программе с General Assembly. Цель проекта - изучить, как мы можем улучшить процесс работы с неструктурированными текстовыми данными с помощью разметки тем. Оглядываясь назад, я присоединился к программе с базовыми знаниями программирования на Python из курса, который я прошел на Udemy. На самом..

Тематическое моделирование с помощью Scikit Learn
Скрытое распределение Дирихле (LDA) - это алгоритм, используемый для обнаружения тем, присутствующих в корпусе. Существует несколько библиотек с открытым исходным кодом, но если вы используете Python, то главный претендент - Gensim . Gensim - отличная библиотека, которая очень хорошо масштабируется для больших текстовых корпусов. Gensim, однако, не включает неотрицательную матричную факторизацию (NMF), которая также может использоваться для поиска тем в тексте. Математическая основа,..

Основы машинного обучения (часть 14): линейный дискриминантный анализ
Линейный дискриминантный анализ (LDA) обычно используется для классификации шаблонов между двумя классами, однако его можно расширить для классификации нескольких шаблонов. Он используется в качестве метода уменьшения размерности, известного как этап предварительной обработки перед классификацией шаблонов в машинном обучении. Уменьшение размеров означает простое построение многомерных данных всего в 2 или 3 измерениях. LDA предполагает, что все классы линейно разделимы, и в соответствии с..