Публикации по теме 'classification'


Ответ на вопрос "да" или "нет" - логистическая регрессия.
Логистическая регрессия - это метод моделирования, используемый для прогнозирования вероятности наступления события. Переменная ответа, то есть базовое событие, имеет только два результата: происходит или не происходит. Например, воины выигрывают следующую игру, клиент кредитной карты привлекается в течение трех месяцев после участия и т. Д. Иногда зависимую (ответную) переменную сложнее определить в двоичном виде. Будет ли новый запуск успешным? Здесь аналитик или бизнес-потребности..

Дерево регрессии в Python с нуля
Написание популярного алгоритма дерева регрессии на Python и объяснение того, что скрывается под капотом Эта статья призвана представить читателям код и интуицию, лежащую в основе алгоритма дерева регрессии в Python. Я считаю, что просмотр кода алгоритма является очень хорошим обучающим инструментом, чтобы понять, что происходит под капотом. Надеюсь, читателям это тоже пригодится. Объясняемый алгоритм - это алгоритм дерева регрессии. Он используется для моделирования взаимосвязи..

Есть несбалансированные классы? Попробуйте важные термины
Слова, важные для класса, можно использовать для улучшения компромисса между точностью и воспроизведением при классификации. Использование наиболее значимых терминов в качестве словаря для управления классификатором дает улучшенные результаты с моделью гораздо меньшего размера для прогнозирования повторных разрешений MIMIC-III CCU из выписанных примечаний… И это сложнее (прости, Йоги!), Когда целевые классы, которые можно предсказать, имеют сильно различающиеся опоры. Но это часто..

Классифицируйте болезни листьев растений с помощью машинного обучения
"Машинное обучение" Классифицируйте болезни листьев растений с помощью машинного обучения В этой статье мы разработаем модель машинного обучения, которая предсказывает болезни, от которых страдает растение. Сельское хозяйство играет очень важную роль в экономическом росте любой страны. Это область, которая сильно влияет на ВВП стран. На сельскохозяйственный сектор приходится около 16 % ВВП Индии. На качество и количество выращиваемых культур влияют различные факторы. Из-за..

Не все ошибки одинаковы: обучение с учетом затрат
Обучение с учетом затрат - необходимый подход для решения многих проблем. Прочтите, чтобы узнать, как это работает. В задачах классификации мы часто предполагаем, что все ошибки в классификации одинаково плохи. Однако иногда это не так. Рассмотрим пример попытки определить, существует ли террористическая угроза или нет. Существует два типа неправильной классификации: либо мы прогнозируем, что угроза есть, но на самом деле угрозы нет (ложное срабатывание), либо мы прогнозируем, что..

Бинарная классификация с логистической регрессией
Оценка CTR интернет-рекламы В перфоманс-маркетинге важным ключевым показателем эффективности (KPI) является рейтинг кликов (CTR). CTR - это отношение пользователей, которые нажимают на определенную ссылку, к общему количеству пользователей, просматривающих страницу, электронную почту или рекламу (рекламу). Оценка CTR - это проблема бинарной классификации. Когда пользователь просматривает рекламу, он либо нажимает (y=1) , либо не нажимает (y=0) . Имея только два возможных результата,..

Анализ твитов о COVID — Часть 3
Создание классификатора настроений В продолжение моих предыдущих блогов, часть-1 и часть-2 , где мы исследовали данные твитов о COVID и выполнили тематическое моделирование соответственно, в этой части мы создадим классификатор настроений. Хотя базовое исследование данных было выполнено в предыдущих частях, мы снова показываем небольшой проблеск данных!! A) Предварительный просмотр используемого набора данных. Взгляд на набор данных COVID Tweet Данные твитов доступны..