Публикации по теме 'data-science'
Анализ настроений в социальных сетях с использованием машинного обучения: Часть - I
Социальные сети открыли для людей всего мира совершенно новый мир. Люди находятся на расстоянии одного клика от получения огромного количества информации. Вместе с информацией приходит мнение людей, а вместе с ним и положительное, и отрицательное отношение людей к теме. Иногда это также приводит к издевательствам и ненависти в отношении кого-то или чего-то.
Итак, в этой статье мы будем использовать набор данных, содержащий коллекцию твитов, для определения настроения, связанного с..
Алгоритмы ранжирования - знайте свои методы решения многокритериальных решений!
Давайте рассмотрим некоторые из основных алгоритмов решения сложных задач принятия решений, на которые влияют несколько критериев. Мы обсудим, зачем нам такие методы, и исследуем доступные алгоритмы в крутом пакете python skcriteria.
Вступление
Предположим, вам нужно принять решение - например, купить дом, машину или даже гитару. Вы не хотите выбирать случайным образом или поддаваться предвзятости из-за чьего-либо предложения, но хотите принять обоснованное решение. Для этого вы..
От Pandas до Scikit-Learn - новый увлекательный рабочий процесс
От Pandas до Scikit-Learn - новый увлекательный рабочий процесс
Новая интеграция Scikit-Learn с Pandas
Scikit-Learn сделает одно из самых больших обновлений за последние годы, выпустив гигантскую версию 0.20 . Для многих специалистов по обработке данных типичный рабочий процесс состоит из использования Pandas для исследовательского анализа данных перед переходом к scikit-learn для машинного обучения. Этот новый выпуск сделает процесс более простым, многофункциональным, надежным и..
В чем разница между ИИ и машинным обучением
Развитие аналитического эко-пространства в недавнем прошлом достигло новых высот. Появление новых инструментов и методов, безусловно, облегчило жизнь профессионалам-аналитикам в работе с данными. Более того, огромные объемы данных, которые генерируются из различных источников, требуют огромной вычислительной мощности и системы хранения для анализа.
Три наиболее часто используемых термина в аналитике — это интеллектуальный анализ данных, машинное обучение и наука о данных, которые..
Как объединить PCA и K-средства в Python?
Знаете ли вы, что вы можете комбинировать анализ основных компонентов (PCA) и кластеризацию K-средних для улучшения результатов сегментации? В этом руководстве мы увидим практический пример сочетания PCA и K-средних для кластеризации данных с использованием Python.
Зачем комбинировать СПС и К-средства?
Существуют различные причины для использования шага уменьшения размерности, такого как PCA, перед сегментацией данных. Главный из них? Уменьшая количество функций, мы улучшаем..
5 основных аналитических функций SQL, которые должен знать каждый аналитик данных
Аналитические функции SQL, чтобы вывести ваши аналитические навыки на новый уровень
Аналитические функции - один из самых популярных инструментов среди аналитиков бизнес-аналитики / данных для выполнения комплексного анализа данных. Эти функции выполняют вычисления над несколькими строками и также возвращают несколько строк. Сегодня мы рассмотрим 5 функций, которые я считаю наиболее полезными, с множеством практических примеров.
Для непосвященных относительный размер запроса с..
LDA2vec: вложения слов в тематические модели
Узнайте больше о LDA2vec, модели, которая изучает плотные векторы слов вместе с распределенными по Дирихле скрытыми смесями тематических векторов на уровне документа.
В этом сообщении блога вы познакомитесь с lda2vec, тематической моделью, опубликованной Крисом Муди в 2016 году . lda2vec расширяет модель word2vec, описанную Mikolov et al. в 2013 , с векторами тем и документов и объединяет идеи как встраивания слов, так и моделей тем.
Общая цель тематической модели - создать..