Публикации по теме 'clustering'


ML: кластеризация K-средних
K-средство - это секционная кластеризация, метод разделения n точек данных на k секций. Это странный термин, потому что кластеризация - это разделение данных. Фактически, секционная кластеризация проходит через все данные с самого начала, чтобы найти k-раздел. С другой стороны, иерархическая кластеризация начинается с одной точки. Теперь давайте посмотрим на K-means K-означает K-средство просто находит k-центроид кластеров. Центроид означает среднее значение каждой координаты..

Свежий взгляд на алгоритмы кластеризации
"Видеоурок" Свежий взгляд на алгоритмы кластеризации Глубокое погружение в новую методологию распознавания кластеров. Проект далеко не на завершающей стадии. Поделитесь текущим мышлением и детально проработайте код, чтобы получить обратную связь и посмотреть, стоит ли это развивать дальше. Родился из-за разочарования в текущих методах (по крайней мере, тех, которые доступны через стандартные библиотеки), в частности, из-за специального характера всех основных подходов, включая..

Cancer Genomics III: определение закономерностей прогрессирования рака печени на основе геномных данных
Автор Сохил Шах [ LinkedIn ] [ GitHub ] Соавторы: Николас Джангреко [ LinkedIn ] [ GitHub ], Хорди Франк [ LinkedIn ] [ GitHub ] и Мэтью Энг [ LinkedIn ] [ GitHub ] Это пост 3 из 4-х частей серии по геномике рака. Вы можете найти код из этого поста на Github . Если нет, ознакомьтесь с Постом 1 , в котором объясняется, как нужна геномная перспектива для поиска новых методов лечения рака печени, и Постом 2 , в котором подробно рассказывается о исследовательском анализе,..

Глубокое погружение в агломеративную кластеризацию!
Введение. В этой статье рассматриваются все аспекты агломерационной кластеризации в рамках одного проекта. Просьба ко всем, пожалуйста, ознакомьтесь с моими статьями о кластеризации и иерархической кластеризации, прежде чем проходить через это, потому что это будет большим подспорьем для вас, ребята, поскольку поможет понять основы кластеризации и ее типа «Иерархическая кластеризация»! Что такое кластеризация? Введение. Вы когда-нибудь думали об..

Использование кластеризации для изучения характеристик клиентов
Идея этого проекта состоит в том, чтобы проанализировать, какие функции лучше всего определяют потенциальных клиентов для данной компании. Для этого предоставляются два набора данных, один из которых содержит информацию обо всем населении, а второй набор данных содержит информацию о реальных клиентах. Изучая эти два набора данных с использованием методов обучения без учителя, можно будет наблюдать, каковы особенности клиентов по сравнению со всем населением. Эти выводы, в свою очередь,..

Битва за соседство
Откройте индийский ресторан на Манхэттене, Нью-Йорк. Введение : Цель этого проекта — найти наиболее перспективное место для открытия аутентичного индийского ресторана на Манхэттене, Нью-Йорк. В Нью-Йорке проживает более 3,2 миллиона жителей, родившихся за пределами США. В Нью-Йорке проживает около 315 000 человек с Индийского субконтинента. Это разнообразие в культуре также влияет на разнообразие пищи. Вы найдете китайские, тайские, итальянские, индийские рестораны по всему..

Наглядная демонстрация K-средних
Вот краткий пример кластеризации методом k-средних на изображении, а код находится на github . В приведенной ниже последовательности показаны три кластера цветов на изображении здания, в результате чего преобразованное изображение содержит только три различных цвета. Исходное изображение размером 228x300 пикселей имело 36 632 уникальных цвета, тогда как изображение внизу справа имеет только восемь уникальных цветов после создания восьми кластеров! Повторение процесса только с..