Публикации по теме 'binary-classification'


Еще одна запись в блоге о логистической регрессии
Проблема В нашем продукте (сочетании поисковой системы для электронной коммерции и торговой площадки) нам приходится ежедневно модерировать множество данных, собранных из различных источников. Различные типы данных для нескольких вариантов использования. Одним из таких случаев является модерация торговых марок. Продавцы, как правило, используют буквально что угодно в качестве названия бренда в своих потоках данных. С другой стороны, мы хотим предоставить нашим покупателям удобный..

Удовлетворенность клиентов Santander
СОДЕРЖАНИЕ: Бизнес-проблема М.Л. Постановка задачи. Обзор набора данных Существующие подходы к проблеме Мое улучшение существующего подхода Показатель производительности Исследовательский анализ данных Мой первый подход к проблеме Предварительная обработка функций Функциональная инженерия Моделирование Резюме моделей Заключение Видео, демонстрирующее окончательно развернутую модель: Будущая работа Ссылки Linkedin и Github использованная литература 1...

Позитивный класс? Что это должно быть? в задаче бинарной классификации машинного обучения?
Что такое позитивный класс? Предположим, у вас есть целевая переменная: смерть или не смерть, жизнь или не жизнь, крупная авария или не крупная авария и так далее. Как бы вы решили, что положительный класс получит правильные метрики, чтобы сообщить, насколько хорошо работает ваша модель бинарной классификации? Проблема Идея этой статьи возникла, когда я решал задачу бинарной классификации на онлайн-соревновании, в котором участвовал. Целевой переменной, представляющей интерес, была..

Сверхспособности кривой ROC и AUC: классификация данных с уверенностью
Расшифровка ROC-кривой и AUC и важность показателей оценки Привет, энтузиасты данных! Сегодня мы поговорим об одной из самых интересных и увлекательных тем в мире машинного обучения: ROC Curve и AUC. Эти две аббревиатуры могут показаться пугающими, но не волнуйтесь, я вас поддержу. В этом посте мы рассмотрим, что такое ROC и AUC, почему они необходимы для классификации данных и как их можно использовать для повышения производительности ваших моделей. Итак, расслабьтесь, выпейте..

Калибровка вероятности в моделях бинарной классификации: обзор с примерами Python
Введение Как специалисты по данным, мы часто придаем большое значение тому, чтобы прогнозируемые вероятности, полученные на основе моделей машинного обучения, были хорошо откалиброваны. Хорошо откалиброванная модель имеет решающее значение для многих приложений в реальном мире, таких как медицинская диагностика, обнаружение мошенничества и прогнозирование вероятности дефолта. Если модель плохо откалибрована, она может назначать слишком экстремальные вероятности, что приводит к принятию..

Простейшая реализация модели Pytorch для двоичной классификации
Введение: Pytorch — замечательная библиотека для написания кода машинного обучения на производственном уровне и проектирования моделей глубокого обучения. Сегодня я собираюсь показать самый простой способ использования Pytorch для обучения модели глубокого обучения всего несколькими строками. Для этого мы будем использовать вспомогательную библиотеку с именем msdlib. Его открытый исходный код, полностью бесплатный и доступный для установки через pip, очень эффективный и дает..

Обнаружение и анализ мошенничества в сфере здравоохранения с использованием машинного обучения
Анализ мошеннических практик для выявления закономерностей и применение машинного обучения для обнаружения мошенничества в будущем. Оглавление: Введение Бизнес-проблема Проблема машинного обучения Ограничения бизнеса Метрика производительности Набор данных и анализ столбцов EDA и предварительная обработка Разработка функций Модели машинного обучения Поведение лучшей модели Окончательный конвейер данных Производство Будущая работа Репозиторий Linkedin и Github..