Публикации по теме 'classification'
Ответ на вопрос "да" или "нет" - логистическая регрессия.
Логистическая регрессия - это метод моделирования, используемый для прогнозирования вероятности наступления события. Переменная ответа, то есть базовое событие, имеет только два результата: происходит или не происходит. Например, воины выигрывают следующую игру, клиент кредитной карты привлекается в течение трех месяцев после участия и т. Д.
Иногда зависимую (ответную) переменную сложнее определить в двоичном виде. Будет ли новый запуск успешным? Здесь аналитик или бизнес-потребности..
Дерево регрессии в Python с нуля
Написание популярного алгоритма дерева регрессии на Python и объяснение того, что скрывается под капотом
Эта статья призвана представить читателям код и интуицию, лежащую в основе алгоритма дерева регрессии в Python. Я считаю, что просмотр кода алгоритма является очень хорошим обучающим инструментом, чтобы понять, что происходит под капотом. Надеюсь, читателям это тоже пригодится.
Объясняемый алгоритм - это алгоритм дерева регрессии. Он используется для моделирования взаимосвязи..
Есть несбалансированные классы? Попробуйте важные термины
Слова, важные для класса, можно использовать для улучшения компромисса между точностью и воспроизведением при классификации. Использование наиболее значимых терминов в качестве словаря для управления классификатором дает улучшенные результаты с моделью гораздо меньшего размера для прогнозирования повторных разрешений MIMIC-III CCU из выписанных примечаний…
И это сложнее (прости, Йоги!), Когда целевые классы, которые можно предсказать, имеют сильно различающиеся опоры.
Но это часто..
Классифицируйте болезни листьев растений с помощью машинного обучения
"Машинное обучение"
Классифицируйте болезни листьев растений с помощью машинного обучения
В этой статье мы разработаем модель машинного обучения, которая предсказывает болезни, от которых страдает растение.
Сельское хозяйство играет очень важную роль в экономическом росте любой страны. Это область, которая сильно влияет на ВВП стран. На сельскохозяйственный сектор приходится около 16 % ВВП Индии. На качество и количество выращиваемых культур влияют различные факторы. Из-за..
Не все ошибки одинаковы: обучение с учетом затрат
Обучение с учетом затрат - необходимый подход для решения многих проблем. Прочтите, чтобы узнать, как это работает.
В задачах классификации мы часто предполагаем, что все ошибки в классификации одинаково плохи. Однако иногда это не так. Рассмотрим пример попытки определить, существует ли террористическая угроза или нет. Существует два типа неправильной классификации: либо мы прогнозируем, что угроза есть, но на самом деле угрозы нет (ложное срабатывание), либо мы прогнозируем, что..
Бинарная классификация с логистической регрессией
Оценка CTR интернет-рекламы
В перфоманс-маркетинге важным ключевым показателем эффективности (KPI) является рейтинг кликов (CTR). CTR - это отношение пользователей, которые нажимают на определенную ссылку, к общему количеству пользователей, просматривающих страницу, электронную почту или рекламу (рекламу).
Оценка CTR - это проблема бинарной классификации. Когда пользователь просматривает рекламу, он либо нажимает (y=1) , либо не нажимает (y=0) . Имея только два возможных результата,..
Анализ твитов о COVID — Часть 3
Создание классификатора настроений
В продолжение моих предыдущих блогов, часть-1 и часть-2 , где мы исследовали данные твитов о COVID и выполнили тематическое моделирование соответственно, в этой части мы создадим классификатор настроений.
Хотя базовое исследование данных было выполнено в предыдущих частях, мы снова показываем небольшой проблеск данных!!
A) Предварительный просмотр используемого набора данных.
Взгляд на набор данных COVID Tweet
Данные твитов доступны..