Публикации по теме 'clustering'
Кластеризация данных смешанного типа
Кластеризация данных смешанного типа
Предлагаемый подход с использованием R
О
Кластеризация неконтролируемых данных - непростая задача . Действительно, обработка и исследование данных в таком контексте часто определяется знанием предметной области, если не чистой интуицией, и затрудняется из-за невозможности измерить точность результирующей сегментации (в отличие от обучения с учителем).
Кроме того, вводные курсы по обучению без учителя довольно часто обсуждают идеальные..
Изучите метод кластеризации 101 за 5 минут
Введение
В реальной жизни мы можем столкнуться с проблемой, когда хотим сгруппировать наши данные и изучить базовую структуру. Например, поиск подгруппы наших пользователей может помочь нам разработать более конкретные маркетинговые стратегии.
Другой пример: у нас есть много данных, и мы хотим сжать их до меньшего количества используемых функций. Методом, решающим такую проблему, является кластеризация.
Кластеризация — один из самых популярных неконтролируемых подходов. Он..
Реализация кластеризации маркеров угловая с использованием Google Charts
Карты — отличный способ отображения данных, но когда у нас есть больше точек данных на карте, мы можем отобразить больше информации, но это не всегда так. В идеале вы могли бы обобщить базовые данные, для чего требуется технология кластеризации карты. Существуют различные способы реализации кластеризации, но в этом посте я объясню вам, как я реализовал кластеризацию маркеров с помощью Google Map и Chart. Я использовал диаграмму Google для отображения круговой диаграммы вместо..
Сумка визуальных слов в двух словах
Искусство выбирать важные черты
Пакет визуальных слов (BOVW) обычно используется при классификации изображений. Его концепция заимствована из поиска информации и словарного запаса НЛП (BOW). В пакете слов (BOW) мы подсчитываем количество каждого слова, встречающегося в документе, используем частоту каждого слова, чтобы узнать ключевые слова документа, и строим из него частотную гистограмму. Мы относимся к документу как к мешку слов (ЛУК). У нас та же концепция в пакете визуальных..
Обнаружение аномалий
Введение
Я читал о различных методах обнаружения аномалий в наборах данных. В своем стремлении узнать, что такое обнаружение аномалий и как это можно сделать, я решил написать этот блог, чтобы составить список некоторых методов, а также то, что отличает обнаружение аномалий от обучения с учителем.
Обнаружение аномалий и контролируемое обучение
Давайте рассмотрим набор данных с двумя типами точек данных: положительные примеры, т. е. аномалии, и отрицательные примеры, т. е...
Защитите свое облако с помощью обнаружения угроз StegoSOC на основе искусственного интеллекта
Этот пост о том, как мы пытаемся автоматизировать обнаружение угроз для предприятия, будь то общедоступное, частное или гибридное облако.
Обнаружение угроз в реальном времени является обязательным условием GDPR и других киберзаконов. Обнаружение угроз всегда было дорогостоящим решением. Для реализации решения требуется CSO и аналитик по безопасности.
StegoSOC сокращает время на обнаружение угроз за 1/10 стоимости общедоступных облаков с помощью искусственного интеллекта и облачных..
Визуализируйте многомерные наборы данных в виде двумерного графика с помощью t-SNE (например, набор данных о бронированиях Airbnb).
Алгоритм t-распределенного стохастического встраивания соседей (t-SNE)
Прежде всего, что такое t-SNE и когда и почему мы его используем ? Это алгоритм unsupervised и non-linear dimension reduction , люди обычно используют его во время exploratory data analysis , ранней стадии всего конвейера машинного обучения. Это помогает нам отображать многомерные наборы данных (например, многие функции) с помощью 2D- или 3D-графика (или других относительно небольших чисел) и, таким..