Публикации по теме 'clustering'


Кластеризация данных смешанного типа
Кластеризация данных смешанного типа Предлагаемый подход с использованием R О Кластеризация неконтролируемых данных - непростая задача . Действительно, обработка и исследование данных в таком контексте часто определяется знанием предметной области, если не чистой интуицией, и затрудняется из-за невозможности измерить точность результирующей сегментации (в отличие от обучения с учителем). Кроме того, вводные курсы по обучению без учителя довольно часто обсуждают идеальные..

Изучите метод кластеризации 101 за 5 минут
Введение В реальной жизни мы можем столкнуться с проблемой, когда хотим сгруппировать наши данные и изучить базовую структуру. Например, поиск подгруппы наших пользователей может помочь нам разработать более конкретные маркетинговые стратегии. Другой пример: у нас есть много данных, и мы хотим сжать их до меньшего количества используемых функций. Методом, решающим такую ​​проблему, является кластеризация. Кластеризация — один из самых популярных неконтролируемых подходов. Он..

Реализация кластеризации маркеров угловая с использованием Google Charts
Карты — отличный способ отображения данных, но когда у нас есть больше точек данных на карте, мы можем отобразить больше информации, но это не всегда так. В идеале вы могли бы обобщить базовые данные, для чего требуется технология кластеризации карты. Существуют различные способы реализации кластеризации, но в этом посте я объясню вам, как я реализовал кластеризацию маркеров с помощью Google Map и Chart. Я использовал диаграмму Google для отображения круговой диаграммы вместо..

Сумка визуальных слов в двух словах
Искусство выбирать важные черты Пакет визуальных слов (BOVW) обычно используется при классификации изображений. Его концепция заимствована из поиска информации и словарного запаса НЛП (BOW). В пакете слов (BOW) мы подсчитываем количество каждого слова, встречающегося в документе, используем частоту каждого слова, чтобы узнать ключевые слова документа, и строим из него частотную гистограмму. Мы относимся к документу как к мешку слов (ЛУК). У нас та же концепция в пакете визуальных..

Обнаружение аномалий
Введение Я читал о различных методах обнаружения аномалий в наборах данных. В своем стремлении узнать, что такое обнаружение аномалий и как это можно сделать, я решил написать этот блог, чтобы составить список некоторых методов, а также то, что отличает обнаружение аномалий от обучения с учителем. Обнаружение аномалий и контролируемое обучение Давайте рассмотрим набор данных с двумя типами точек данных: положительные примеры, т. е. аномалии, и отрицательные примеры, т. е...

Защитите свое облако с помощью обнаружения угроз StegoSOC на основе искусственного интеллекта
Этот пост о том, как мы пытаемся автоматизировать обнаружение угроз для предприятия, будь то общедоступное, частное или гибридное облако. Обнаружение угроз в реальном времени является обязательным условием GDPR и других киберзаконов. Обнаружение угроз всегда было дорогостоящим решением. Для реализации решения требуется CSO и аналитик по безопасности. StegoSOC сокращает время на обнаружение угроз за 1/10 стоимости общедоступных облаков с помощью искусственного интеллекта и облачных..

Визуализируйте многомерные наборы данных в виде двумерного графика с помощью t-SNE (например, набор данных о бронированиях Airbnb).
Алгоритм t-распределенного стохастического встраивания соседей (t-SNE) Прежде всего, что такое t-SNE и когда и почему мы его используем ? Это алгоритм unsupervised и non-linear dimension reduction , люди обычно используют его во время exploratory data analysis , ранней стадии всего конвейера машинного обучения. Это помогает нам отображать многомерные наборы данных (например, многие функции) с помощью 2D- или 3D-графика (или других относительно небольших чисел) и, таким..