Публикации по теме 'accuracy-paradox'


Что делать, если ярлыки перекосились: решение парадокса точности
С начала 2018 года я пытался решать различные повседневные проблемы в своей работе, используя простые модели глубокого обучения (см. Глубокое обучение по структурированным данным Часть 1 и Часть 2 ). Проблема, с которой я столкнулся, - прогнозирование времени до облегчения (TTR) для билетов в службу поддержки Db2 - имела преимущество в виде разумно сбалансированных этикеток. Входные данные распределились следующим образом: 0 этикеток - TTR ≤ 1 день: 39% 1 этикетка - TTR ›1 день:..

Парадокс точности. Как не попасть в ловушку несбалансированного набора данных.
Ни для кого не секрет, что при работе с данными в области машинного обучения (и не только) значительная часть времени тратится на изучение набора данных, очистку данных, проектирование функций, и только сравнительно небольшая часть усилий идет на на создание, оценку и настройку наших моделей. Такое распределение времени вполне разумно, поскольку точность и надежность наших результатов напрямую зависит от качества и удобства нашего набора данных. Но иногда из-за нехватки времени или..