Публикации по теме 'clustering'


K означает кластеризацию текстовых данных
K означает кластеризацию текстовых данных Требуется обучение кластеризации? Обзор курсов , разработанный лидерами отрасли и Experfy в Harvard Innovation Lab. Кластеризация / сегментация - один из наиболее важных методов, используемых в Acquisition Analytics. K означает кластеризацию, объединяющую похожие наблюдения в кластеры, чтобы иметь возможность извлекать информацию из огромных объемов неструктурированных данных. Когда вы хотите проанализировать комментарии Facebook /..

Кластеризация K-средних: шесть простых шагов
Что происходит под капотом — k- означает кластеризацию — и как применять алгоритм. Этот блог является частью моего понимания неконтролируемого обучения. Я кратко расскажу о том, что такое обучение без учителя, а затем дам вам шесть простых шагов, чтобы понять кластеризацию методом k-средних. В неконтролируемом обучении участие человека минимально (если мы рассматриваем людей как машины), а данные не помечены. Неконтролируемое обучение в основном используется в электронной..

Сегментация клиентов и привлечение клиентов: подход машинного обучения
Применяйте методы машинного обучения для прогнозирования клиентов Этот пост посвящен одному из главных проектов, выбранных для Udacity Data Science Nanodegree; Отчет по сегментации клиентов для Bertelsmann / Arvato. Этот проект представляет для меня личный интерес, поскольку он представляет собой реальную задачу по науке о данных с использованием как неконтролируемого, так и контролируемого машинного обучения, а также является соревнованием Kaggle InClass Competition...

Использование машинного обучения для классификации игроков НБА, часть II
В Часть I я собрал 1326 наблюдений¹ 189 признаков с целью выяснить, что именно отличает игроков, чтобы можно было создать новую систему категоризации. В конце концов, традиционная пятипозиционная система немного устарела. Я использовал анализ основных компонентов (PCA), чтобы сократить 189 функций до 81 нового измерения, состоящего из предыдущих функций. 81 новое измерение объясняет 99% общего разброса данных, что, мы надеемся, позволит нам создать разумную систему классификации..

AI Snack # 3: Clustering (Кластеризация)
Юлий Цезарь: «Divida et Impera» (перевод: разделяй и властвуй) На протяжении тысячелетий мы решали большие проблемы, разбивая их на более мелкие, лучше определенные части, на которых мы можем сосредоточить наши усилия: Большая проблема: как продавать товары миллионам клиентов. Проблема меньшего масштаба: Как продавать товары мужчинам в возрасте от 25 до 30 лет, которые зарабатывают от 75 до 120 тысяч в год? Алгоритмы кластеризации наделяют нас даром зрения. Они помогают..

Кластеризация районов Нью-Йорка по ценам на пиццерии
Введение: Целью этого проекта является объединение Нью-Йорка в 4 кластера по ценам на пиццерии. Целевые люди — это люди, которые любят пиццу и хотят посетить Нью-Йорк и остановиться в районе, где цены на пиццу соответствуют его/ее доходу. Другой способ выразить это: Человек X хочет посетить город своей мечты. Нью-Йорк, X любит пиццу, Х хочет остаться в районе, где цены на пиццу соответствуют его доходам. Данные: прежде всего вам нужно знать, что Foursquare предоставляет..

Сначала сегментация, потом то, что вам нужно (иногда я прав, так что поверьте мне)
Недавно я увлекся проектом, направленным на построение целостного представления о жизненном цикле нашего потребителя на основе поведенческих паттернов. Классическая деловая дилемма, звучит широко и сложно, потому что так оно и есть. Это область нашего бизнеса, которой не уделялось должного внимания, а это означает, что весь диагностический процесс более сложен, чем обычно. Все нормально, я профи. Это борьба, с которой сталкивается большинство компаний: кто мой клиент? Только на..