Публикации по теме 'model-performance'
Оптимальная ошибка человека и Байеса.
Частота ошибок Байеса — это наименьшая возможная частота ошибок для любого классификатора случайного результата.
Со временем, по мере того как модели становятся все больше и больше, и они обучаются на все большем количестве данных, производительность приближается, но никогда не превышает теоретический предел, называемый байесовской оптимальной ошибкой (B.O.E.).
Самое печальное в этом то, что это нельзя рассчитать
Часто модель замедляется после или до того, как модель превзойдет..
Раскрытие возможностей перекрестной проверки
Полное руководство по оптимизации производительности модели
Перекрестная проверка — популярный метод машинного обучения и статистического анализа, который включает в себя разделение набора данных на подмножества для оценки и проверки производительности модели. Основная цель перекрестной проверки — оценить, насколько хорошо модель обобщает невидимые данные. Он в основном используется для оценки производительности модели машинного обучения.
Зачем нам нужна перекрестная проверка?..
Обнаружение дрейфа данных с помощью машинного обучения
Обнаружение дрейфа данных с помощью машинного обучения
Узнайте о снижении производительности ваших моделей машинного обучения с помощью простого автоматизированного процесса.
Данные со временем меняются. Это часто непредсказуемо и необъявлено. Эти изменения приводят к тому, что модель, основанная на старых данных, несовместима с новыми данными. Производительность модели ухудшается, и вам необходимо переобучить модель, добавив новые данные. В этом посте объясняются три различных..
Введение в кривые ROC и PR
Большинство моделей классификации учатся выводить оценку для каждого отдельного класса на основе значений столбцов признаков. Оценка часто представляет собой вероятность предсказания того, что конкретный пример относится к выбранной метке класса.
Прогнозируемый ярлык является результатом применения порога принятия решения к этому показателю. Например, давайте рассмотрим модель, которая учится предсказывать, относится ли пациент к группе высокого риска (положительный класс)..
Понимание важных показателей модели машинного обучения — Gini/KS
Модели машинного обучения — это мощные инструменты для прогнозирования и извлечения информации из данных. Однако оценка производительности этих моделей имеет решающее значение для обеспечения их эффективности.
В этом сообщении блога мы рассмотрим несколько важных показателей модели машинного обучения и обсудим, почему они необходимы для оценки производительности модели. Мы также предоставим реализацию кода на Python для расчета этих показателей.
КС (Колмогоров-Смирнов):
KS —..
Поиск баланса между смещением и дисперсией
Всегда сложно построить хорошо обобщенную модель в машинном обучении с учителем. Машинное обучение с учителем — один из наиболее часто используемых и успешных типов машинного обучения. Говорят, что модель хорошо обобщена, когда модель способна делать точные прогнозы/классификации невидимых данных.
Обобщение необходимо для машинного обучения; то, что алгоритм обучения хорошо соответствует обучающим данным, не означает, что это хорошая модель машинного обучения. Это может привести к..
Настройка гиперпараметров с помощью Optuna
Используйте силу байесовской оптимизации
Настройка гиперпараметров — один из самых важных шагов в рабочем процессе машинного обучения. Это процесс выбора набора оптимальных гиперпараметров, которые могут улучшить производительность модели.
Что такое гиперпараметры?
Гиперпараметры — это параметры, которые задаются перед началом обучения модели. Они не усваиваются моделью в процессе обучения.
Методы настройки гиперпараметров
Стоит рассказать о трех методах:
Поиск по..