Публикации по теме 'classification'


Машинное обучение… Для бабушек и дедушек
Дорогая бабушка, Я наткнулся на эту новую тему, о которой хочу вам рассказать. Это называется машинным обучением. Я знаю, что вы не знакомы ни с одним из этих причудливых технических терминов, поэтому сделаю это простым для вас. Машинное обучение (ML) считается подразделом искусственного интеллекта (AI). Он основан на распознавании образов - на способности распознать образец - и на способности учиться. Вкратце, машинное обучение - это процесс, через который проходит..

Классификация несбалансированных наборов данных
Как правильно провести анализ классификации с помощью sklearn, когда ваш набор данных несбалансирован, и улучшить его результаты. Представим, что у вас есть набор данных с десятком функций, и вам нужно классифицировать каждое наблюдение. Это может быть проблема с двумя классами (ваш результат - 1 или 0; истина или ложь) или проблема с несколькими классами (возможно более двух альтернатив). Однако в этом случае есть изюминка. Данные несбалансированы. Подумайте о пациентах, которые..

Кредитный скоринг: рассказ о классификации
Сегодня мы рассмотрим проект классификации, а именно построение модели кредитного скоринга, предназначенной для классификации заявок на получение кредита. Набор данных, который я буду использовать, доступен на Kaggle, его можно найти здесь: https://www.kaggle.com/c/home-credit-default-risk/data . Этот набор данных представляет собой богатую коллекцию, которая включает в себя несколько таблиц, предлагающих многочисленные возможности для разработки признаков. Первые шаги этого проекта..

Как создать собственный оценщик для scikit-learn
Практические руководства Как создать собственный оценщик для scikit-learn Реализация пользовательской модели ансамбля с недостаточной выборкой для несбалансированных данных В этом посте вы узнаете, как реализовать собственную модель и сделать ее совместимой с API scikit-learn. Конечным результатом будет модель, которую можно не только подогнать и использовать для прогнозов, но и использовать в сочетании с другими инструментами scikit-learn, такими как поиск по сетке и конвейеры...

Как измерить производительность классификатора
Классификация — это тип задачи контролируемого машинного обучения, целью которой является прогнозирование класса или категории входного экземпляра на основе набора функций или атрибутов. В задаче классификации целевая переменная (то есть переменная, которую мы хотим предсказать) является категориальной, что означает, что она может принимать дискретный набор значений или меток. Существует два основных типа задач классификации: бинарная классификация и многоклассовая классификация...

Использование моделирования классификации редких событий для прогнозирования плей-офф Кубка Стэнли 2023 года
Кто заберет домой кубок лорда Стэнли в этом году? Введение В машинном обучении (ML) очень сложно точно классифицировать редкое событие по двум причинам: Событие, которое пытаются предсказать, происходит недостаточно часто, чтобы можно было точно определить взаимосвязь между предикторами и переменными отклика. Разделение данных на данные обучения и тестирования затруднено из-за дисбаланса между положительными и отрицательными значениями отклика. Прогнозирование победителя..

Как повысить прогностическую эффективность вашего классификатора?
Когда вы обучаете модель машинного обучения, вы должны рассмотреть следующие шаги, чтобы повысить эффективность прогнозирования вашего классификатора: Можно ли добавить больше помеченных данных для обучения модели? Обычно модели машинного обучения работают лучше по мере увеличения размера набора данных. Если у вас есть возможность добавить больше данных (желательно разнообразных), сделайте это. Вам может быть интересно, можем ли мы продолжать добавлять больше данных, чтобы продолжать..