Публикации по теме 'data-science'


Анализ настроений в социальных сетях с использованием машинного обучения: Часть - I
Социальные сети открыли для людей всего мира совершенно новый мир. Люди находятся на расстоянии одного клика от получения огромного количества информации. Вместе с информацией приходит мнение людей, а вместе с ним и положительное, и отрицательное отношение людей к теме. Иногда это также приводит к издевательствам и ненависти в отношении кого-то или чего-то. Итак, в этой статье мы будем использовать набор данных, содержащий коллекцию твитов, для определения настроения, связанного с..

Алгоритмы ранжирования - знайте свои методы решения многокритериальных решений!
Давайте рассмотрим некоторые из основных алгоритмов решения сложных задач принятия решений, на которые влияют несколько критериев. Мы обсудим, зачем нам такие методы, и исследуем доступные алгоритмы в крутом пакете python skcriteria. Вступление Предположим, вам нужно принять решение - например, купить дом, машину или даже гитару. Вы не хотите выбирать случайным образом или поддаваться предвзятости из-за чьего-либо предложения, но хотите принять обоснованное решение. Для этого вы..

От Pandas до Scikit-Learn - новый увлекательный рабочий процесс
От Pandas до Scikit-Learn - новый увлекательный рабочий процесс Новая интеграция Scikit-Learn с Pandas Scikit-Learn сделает одно из самых больших обновлений за последние годы, выпустив гигантскую версию 0.20 . Для многих специалистов по обработке данных типичный рабочий процесс состоит из использования Pandas для исследовательского анализа данных перед переходом к scikit-learn для машинного обучения. Этот новый выпуск сделает процесс более простым, многофункциональным, надежным и..

В чем разница между ИИ и машинным обучением
Развитие аналитического эко-пространства в недавнем прошлом достигло новых высот. Появление новых инструментов и методов, безусловно, облегчило жизнь профессионалам-аналитикам в работе с данными. Более того, огромные объемы данных, которые генерируются из различных источников, требуют огромной вычислительной мощности и системы хранения для анализа. Три наиболее часто используемых термина в аналитике — это интеллектуальный анализ данных, машинное обучение и наука о данных, которые..

Как объединить PCA и K-средства в Python?
Знаете ли вы, что вы можете комбинировать анализ основных компонентов (PCA) и кластеризацию K-средних для улучшения результатов сегментации? В этом руководстве мы увидим практический пример сочетания PCA и K-средних для кластеризации данных с использованием Python. Зачем комбинировать СПС и К-средства? Существуют различные причины для использования шага уменьшения размерности, такого как PCA, перед сегментацией данных. Главный из них? Уменьшая количество функций, мы улучшаем..

5 основных аналитических функций SQL, которые должен знать каждый аналитик данных
Аналитические функции SQL, чтобы вывести ваши аналитические навыки на новый уровень Аналитические функции - один из самых популярных инструментов среди аналитиков бизнес-аналитики / данных для выполнения комплексного анализа данных. Эти функции выполняют вычисления над несколькими строками и также возвращают несколько строк. Сегодня мы рассмотрим 5 функций, которые я считаю наиболее полезными, с множеством практических примеров. Для непосвященных относительный размер запроса с..

LDA2vec: вложения слов в тематические модели
Узнайте больше о LDA2vec, модели, которая изучает плотные векторы слов вместе с распределенными по Дирихле скрытыми смесями тематических векторов на уровне документа. В этом сообщении блога вы познакомитесь с lda2vec, тематической моделью, опубликованной Крисом Муди в 2016 году . lda2vec расширяет модель word2vec, описанную Mikolov et al. в 2013 , с векторами тем и документов и объединяет идеи как встраивания слов, так и моделей тем. Общая цель тематической модели - создать..