Публикации по теме 'modeling'


От необработанного текста до предсказания модели менее чем за 30 строк Python
Краткое руководство по быстрому изучению конвейеров НЛП Введение Обработка естественного языка (NLP) — это область машинного обучения, которая работает с данными человеческого языка. Работа с человеческим текстом обычно включает в себя стандартные этапы предварительной обработки, такие как очистка данных и преобразование текста в векторы чисел, прежде чем можно будет делать прогнозы с помощью модели машинного обучения. В этой статье мы познакомим вас с примером, объясняющим, как..

Моделирование защиты NBA, часть 1
Вы можете получить эти модели прямо в свой почтовый ящик, подписавшись на нашу бесплатную рассылку здесь . В нашей модели прогнозирования игры ключевым компонентом является оборонительная сила каждой команды. В настоящее время мы используем целостный подход, который изучает единое значение силы каждой команды, а также включает сильные стороны защиты для конкретных игроков. В этой серии статей, состоящей из бесконечных частей, мы предпримем пошаговые шаги, чтобы включить в нашу модель..

Окончательное руководство по повышению производительности модели
Были ли вы когда-нибудь в ситуации, когда вам нужно было получить лучшую модель машинного обучения, но она не работала? Вот окончательное руководство по повышению производительности. 1. Избегайте проверки Возможно, самый простой способ повысить производительность - избежать всего этого безумия проверки . Процитирую моего хорошего друга: Валидация только ухудшает результат Итак, давайте применим нашу модель к данным, на которых она была обучена, и сообщим об эффективности...

Машинное обучение: ошибка перекрестной проверки
Откройте для себя Holdout, K-fold и Leave-One-Out Введение В машинном обучении оценка производительности модели имеет решающее значение для обеспечения ее способности хорошо обобщать невидимые данные. Одним из часто используемых методов для этой цели является перекрестная проверка. Он обеспечивает оценку производительности модели для новых невидимых данных. Мы рассмотрим…

День 20 #DataScience28: выбор и проверка модели
Выбор и проверка модели являются важнейшими компонентами любого проекта по науке о данных. Они включают в себя процесс выбора наилучшей модели для данной проблемы и обеспечения точности и надежности модели. В этой статье мы обсудим важность выбора и проверки модели и то, как они влияют на успех или неудачу проекта по науке о данных. Что такое выбор модели? Выбор модели — это процесс выбора наилучшей модели для данной проблемы. Существует множество различных типов моделей, которые..

Настройка гиперпараметра случайного леса
Случайный лес — это ансамблевый алгоритм машинного обучения, который объединяет несколько деревьев решений для создания более надежной и точной модели. Каждое дерево решений в лесу строится независимо путем случайного выбора подмножества обучающих данных и подмножества признаков для каждого разделения. В процессе обучения алгоритм случайного леса создает лес деревьев решений. Каждое дерево…

Значение регуляризации L1 L2
Примечание по машинному обучению Регуляризация L1 и L2 — важные темы в машинном обучении. Обычно мы знаем, что регуляризация L1 и L2 может предотвратить переоснащение при их изучении. Однако обычно мы останавливаемся на этом вместо того, чтобы понять, почему они могут предотвратить переоснащение. Эта статья помогает понять смысл регуляризации L1 L2. Смысл регуляризации Что такое регуляризация?