Публикации по теме 'practical-data-science'


Несбалансированная жизнь модели машинного обучения | Интуитивное объяснение дисбаланса классов
Задумывались ли вы когда-нибудь, когда вы обучаете модель логистической регрессии на наборе данных о мошеннических транзакциях с кредитными картами, она дает вам такие результаты, как: Точность обучения -› 99,5% 😎 Точность тестирования -› 68% 😑 Тогда вы, вероятно, столкнулись с очень серьезной проблемой, называемой Дисбаланс классов . Официально определяется как -› набор данных, в котором один из двух классов имеет больше выборок, чем другой класс. Теперь давайте на самом деле..