Публикации по теме 'undersampling'


Как обрабатывать несбалансированные наборы данных?
Привет, ребята !! Во время нашего путешествия по машинному обучению мы все сталкивались с множеством наборов данных. Возможно, вы даже сталкивались с несбалансированными наборами данных. Хотите узнать больше о несбалансированных наборах данных? Вы можете проверить ссылку ниже: Почему точность не является хорошим показателем всех проблем классификации? Привет, ребята!! medium.com Существуют разные подходы к обработке..

Предвзятые данные и как с ними бороться
Предвзятые данные и как с ними бороться История недостаточной выборки Мой студент только что закончил диплом с отличием в области науки о данных, связанный с классификацией - или, по крайней мере, он думал, что закончил. Он получил смесь из нескольких тысяч твитов, опубликованных ~ 2000 студентов и ~ 700 предпринимателями из района Бостона. Ему пришлось обучить модель машинного обучения (RandomForestClassifier), которая предсказывала, был ли твит опубликован студентом или..