Публикации по теме 'classification'


Методы оценки классификатора — Практическое объяснение
Методы оценки классификатора — практическое объяснение Точность/отзыв/точность/матрица путаницы/ ROC-кривая/ AUC Гитхаб-репозиторий Почти в 50% всех интервью по науке о данных по всему миру интервьюируемого просят построить и оценить модель бинарной классификации. Это означает классификацию определенного наблюдения как положительного (обычно обозначаемого цифрой 1) или отрицательного (обозначаемого как 0) с учетом набора признаков. Распространенная ошибка, которую совершают..

Как узнать больше за меньшее время с помощью обработки естественного языка (часть 2)
И как создать свой собственный классификатор слов С помощью изящного извлекающего резюмирования текста , который мы создали в Части 1 , мы могли брать новостные статьи и сокращать их вдвое или больше! Теперь пора взять эти статьи и классифицировать их по темам. В этой части мы рассмотрим, как создать мешок слов классификатора НЛП для этого! Как создать классификатор "Сумка слов" (Python) Репозиторий GitHub: Https://github.com/Vedant-Gupta523/text-summarization-project..

Объяснение того, как работает кривая ROC
Кривая рабочих характеристик приемника или Кривая ROC - отличный инструмент для оценки эффективности модели классификации . Измерение общего качества модели не может оставаться тривиальным делом. Модель классификации отображает характеристики входных данных в вероятности попадания в разные категории, поэтому вместо того, чтобы сказать, что эти входные данные выглядят как собака или кошка, модель выводит значение вероятности X, которое можно описать как - этот ввод относится к..

Переходите от новичка к профессионалу в логистической регрессии
Контролируемое обучение - это часть машинного обучения, которая имеет дело с набором данных, к которому прикреплена метка вывода. Для набора данных D = {xᵢ, yᵢ} , где xᵢ ∈ Rᵈ и yᵢ ∈ {C₁, C₂, C₃,…., Cₙ}, и точки запроса xₚ, мы должны предсказать, какой класс эта точка принадлежит. Итак, приступим. 🚗 Допущение логистической регрессии: предполагается, что данные можно разделить линейно или почти линейно. Цель логистической регрессии - найти гиперплоскость, которая лучше..

2. Деревья решений для классификации
Давайте разберемся с деревьями решений без тяжелой математики! Методы на основе деревьев были впервые представлены Лео Брейманом и тремя другими авторами: Джеромом Фридманом, Чарльзом Дж. Стоуном и Р.А. Ольшен, в начале 80-х, так что эти методы существуют довольно давно! Первоначально они были представлены как CART: деревья классификации и регрессии. Дерево решений  — это древовидный метод, используемый в задачах машинного обучения с учителем (т. е. когда мы используем этот метод, мы..

Прогноз погоды с использованием другой модели классификации
Прогнозирование погоды — это применение науки и техники для прогнозирования состояния атмосферы в заданном месте и в определенное время. Прогнозы погоды составляются путем сбора количественных данных о текущем состоянии атмосферы в данном месте и использования метеорологии для прогнозирования того, какими будут погодные условия. Прогнозирование погоды, которое когда-то рассчитывалось вручную на основе главным образом изменений атмосферного давления, текущих погодных условий, состояния неба..

В текстовое сердце тьмы
От нуля до не совсем героя в НЛП через классификацию языка вражды Интернет - это джунгли. Здесь богатое разнообразие и чудесные цвета объединяются, чтобы создать уникальную экосистему, позволяющую использовать новые технологии и методы общения. Но за этим ярким навесом скрывается темная подоплека немодерируемого Интернета - места, где безопасность анонимности стирает границы гражданского дискурса. Здесь вы найдете оскорбления и унижение, оскорбления и насмешки. В этом дивном новом..