Публикации по теме model-performance

Публикации по теме 'model-performance'

Оптимальная ошибка человека и Байеса.

Частота ошибок Байеса — это наименьшая возможная частота ошибок для любого классификатора случайного результата. Со временем, по мере того как модели становятся все больше и больше, и они обучаются на все большем количестве данных, производительность приближается, но никогда не превышает теоретический предел, называемый байесовской оптимальной ошибкой (B.O.E.). Самое печальное в этом то, что это нельзя рассчитать Часто модель замедляется после или до того, как модель превзойдет..

Раскрытие возможностей перекрестной проверки

Полное руководство по оптимизации производительности модели Перекрестная проверка — популярный метод машинного обучения и статистического анализа, который включает в себя разделение набора данных на подмножества для оценки и проверки производительности модели. Основная цель перекрестной проверки — оценить, насколько хорошо модель обобщает невидимые данные. Он в основном используется для оценки производительности модели машинного обучения. Зачем нам нужна перекрестная проверка?..

Обнаружение дрейфа данных с помощью машинного обучения

Обнаружение дрейфа данных с помощью машинного обучения Узнайте о снижении производительности ваших моделей машинного обучения с помощью простого автоматизированного процесса. Данные со временем меняются. Это часто непредсказуемо и необъявлено. Эти изменения приводят к тому, что модель, основанная на старых данных, несовместима с новыми данными. Производительность модели ухудшается, и вам необходимо переобучить модель, добавив новые данные. В этом посте объясняются три различных..

Введение в кривые ROC и PR

Большинство моделей классификации учатся выводить оценку для каждого отдельного класса на основе значений столбцов признаков. Оценка часто представляет собой вероятность предсказания того, что конкретный пример относится к выбранной метке класса. Прогнозируемый ярлык является результатом применения порога принятия решения к этому показателю. Например, давайте рассмотрим модель, которая учится предсказывать, относится ли пациент к группе высокого риска (положительный класс)..

Понимание важных показателей модели машинного обучения — Gini/KS

Модели машинного обучения — это мощные инструменты для прогнозирования и извлечения информации из данных. Однако оценка производительности этих моделей имеет решающее значение для обеспечения их эффективности. В этом сообщении блога мы рассмотрим несколько важных показателей модели машинного обучения и обсудим, почему они необходимы для оценки производительности модели. Мы также предоставим реализацию кода на Python для расчета этих показателей. КС (Колмогоров-Смирнов): KS —..

Поиск баланса между смещением и дисперсией

Всегда сложно построить хорошо обобщенную модель в машинном обучении с учителем. Машинное обучение с учителем — один из наиболее часто используемых и успешных типов машинного обучения. Говорят, что модель хорошо обобщена, когда модель способна делать точные прогнозы/классификации невидимых данных. Обобщение необходимо для машинного обучения; то, что алгоритм обучения хорошо соответствует обучающим данным, не означает, что это хорошая модель машинного обучения. Это может привести к..

Настройка гиперпараметров с помощью Optuna

Используйте силу байесовской оптимизации Настройка гиперпараметров — один из самых важных шагов в рабочем процессе машинного обучения. Это процесс выбора набора оптимальных гиперпараметров, которые могут улучшить производительность модели. Что такое гиперпараметры? Гиперпараметры — это параметры, которые задаются перед началом обучения модели. Они не усваиваются моделью в процессе обучения. Методы настройки гиперпараметров Стоит рассказать о трех методах: Поиск по..