Публикации по теме 'classification'


Классифицировать субреддиты Reddit по содержанию постов
Reddit – это американский веб-сайт, на котором собираются социальные новости, рейтинг веб-контента и дискуссионный веб-сайт. Зарегистрированные участники отправляют контент на сайт, такой как ссылки, текстовые сообщения и изображения, которые затем голосуют за или против других участников. Википедия При обработке естественного языка иногда люди хотят, чтобы компьютер мог самостоятельно идентифицировать определенные характеристики поста для решения более сложных задач. Например, мы..

контролируемое обучение
Прогноз цен на жилье («пример алгоритма контролируемого обучения») с помощью алгоритма поставить прямую линию к данным (лучше?) было бы лучше подогнать квадратичную функцию или функцию второго многочлена → как выбрать или как решить, какая функция будет лучше предсказывать данные. Контролируемое обучение отражает тот факт, что мы дали алгоритму набор данных, в котором даны так называемые «правильные ответы» → по какой фактической цене продаются дома ← задача алгоритма..

Классификация против регрессии
В этом блоге мы рассмотрим алгоритмы классификации и регрессии в машинном обучении. В машинном обучении классификация и регрессия подпадают под контролируемое обучение. Контролируемое обучение Это подкатегория машинного обучения и искусственного интеллекта . Обучение с учителем — это задача машинного обучения для изучения функции, которая сопоставляет входные данные с выходными на основе примеров пар вход-выход. Он выводит функцию из помеченных обучающих данных, состоящих из..

Показатели производительности для моделей машинного обучения (часть 4: точность)
Метрики классификации в Python доктора Элвина Анга https://www.alvinang.sg/s/Classification_Metrics_for_ML_Models_by_Dr_Alvin_Ang.ipynb Когда использовать Что? Что такое точность? Точность от 0 до 1 0 = ПЛОХОЕ 1 = ХОРОШО Проблемы с использованием Точности Метрику точности можно использовать только в сбалансированном наборе данных. Если он используется в несбалансированном наборе данных, результат может быть очень точным, даже если это НЕ. Чтобы..

Как создать отраслевой классификатор машинного обучения
Подход к многоклассовой классификации текста Martech собирает лучшее, что могут предложить технологии, для достижения измеримых маркетинговых целей и успеха, и, как таковые, предлагает почву для исследований. В этой статье мы рады поделиться своими с трудом заработанными знаниями о создании отраслевого классификатора. Мы покажем вам, как мы обучили модель делать обоснованные предположения о более высоких порогах вероятности и классифицировать разные электронные письма по..

Матрица путаницы: инструмент оценки в задачах классификации
Ключевые слова: машинное обучение, глубокое обучение, классификация, специалист по данным, ИИ. Области машинного обучения и искусственного интеллекта растут день ото дня и эффективно используются в разных сферах нашей жизни. В задачах классификации для оценки производительности алгоритма используются различные метрики и инструменты. Одна из них, «Матрица путаницы», играет важную роль в оценке моделей классификации. В этой статье мы рассмотрим, что такое матрица путаницы, как она..

Все, что вам нужно знать о кривой рабочих характеристик приемника (ROC) в машинном обучении
Подробное обсуждение определения, интерпретации, ограничений, сложности вычислений кривой ROC и расширения до мультиклассов. Фон Кривая рабочих характеристик приемника, короче ROC-кривая, представляет собой механизм для измерения и визуализации производительности классификатора. Мы хотим, чтобы классификатор идентифицировал как можно больше релевантных примеров. Но в то же время мы не хотим, чтобы он давал слишком много ложных срабатываний. Кривая ROC отображает взаимосвязь между..