Публикации по теме classification

Публикации по теме 'classification'

Создание конвейера машинного обучения с обработкой утечки данных

Создание сквозного конвейера в машинном обучении (ML) включает несколько этапов, таких как предварительная обработка данных, обучение модели, оценка и развертывание. Однако одной из критических проблем, которая может повлиять на производительность модели, является утечка данных. Утечка данных происходит, когда для создания модели используется информация извне обучающих данных, что приводит к чрезмерно оптимистичным оценкам производительности. В этой статье мы рассмотрим ключевые моменты,..

Сделайте логистическую регрессию снова простой

Предположим, вы - специалист по данным, стремящийся разработать модель оттока / удержания: модель, позволяющая предсказать, вернется ли конкретный клиент, чтобы купить больше ваших продуктов, или вместо этого полностью откажется от ваших услуг. Во многих случаях вам нужно предсказать не только, кто будет сохранен, а кто нет, но и почему . (Если мы поймем эти факторы, мы сможем удержать больше клиентов в будущем, что хорошо для бизнеса!) Другими словами, ваша модель должна быть..

Строительные блоки DS — Регрессия и классификация

Понять разницу между проблемами регрессии и классификации [Эта запись в блоге изначально была опубликована Иво Бернардо в блоге DareData как «DS — Building Blocks: Regression vs. Classification ] Если вы не являетесь техническим специалистом или руководителем проекта в области искусственного интеллекта или науки о данных, вы, вероятно, чувствуете себя немного перегруженным всеми техническими терминами, которые вам бросают. Некоторые примеры вещей, которые вы, возможно, видели...

Классификация типов электромобилей с использованием машинного обучения

Проект направлен на глубокое понимание электромобилей и разработку модели классификации наиболее эффективных типов электромобилей. Репозиторий GitHub : GitHub — crypter70/Electric-Vehicle-Type-Classification: проект направлен на поиск глубоких знаний… Целью проекта является поиск глубоких сведений об электромобилях и разработка модели классификации из самых эффективных… github.com Фон В последнее время большое внимание уделяется..

Перекрестная проверка с кодом на Python

Да, здесь мы закодируем 5 разных техник! Перекрестная проверка — один из наиболее эффективных способов интерпретации производительности модели. Это гарантирует, что модель точно соответствует данным, а также проверяет наличие переобучения. Это процесс оценки того, как результаты статистического анализа будут обобщены на независимый набор данных. Переоснащение происходит, когда модель идеально подходит для тренировочного набора и плохо работает, когда дело доходит до тестового набора...

Кривые ROC и AUC: оценка эффективности модели классификации

Кривые ROC и AUC (площадь под кривой) — это две важные концепции, используемые для оценки эффективности моделей классификации. Кривые ROC обеспечивают графическое представление компромисса между истинно положительными показателями и ложноположительными показателями, а AUC обеспечивает единую числовую меру эффективности модели. Кривые ROC и AUC обычно используются в машинном обучении, статистике и других областях для оценки производительности бинарных классификаторов. Бинарный..

Моделирование вероятности качания

Один из аспектов бейсбола, который очаровывал меня в течение многих лет, - это мысленная игра в шахматы, которая происходит между отбивающим и питчером во время игры с битой. Каждый игрок постоянно пытается залезть в голову своему противнику и угадать, что он может сделать дальше. Тестирующий может использовать свои знания о питчере, чтобы предсказать, попытается ли он бросить вызов нападающему фастболом или соблазнить его выгнать разбивающийся мяч из зоны. Тем временем питчер..