Публикации по теме 'pre-processing'


Эффективная предварительная обработка данных в машинном обучении: оптимизируйте рабочий процесс с помощью scikit-learn…
Вы когда-нибудь задумывались, почему так много фрагментов кода машинного обучения на Kaggle упускают из виду один из самых мощных инструментов в арсенале scikit? Пришло время пролить свет на часто игнорируемый, но очень эффективный метод использования конвейеров scikit для бесшовной предварительной обработки данных и моделирования. Во-первых, давайте рассмотрим важную роль предварительной обработки данных в машинном обучении. Независимо от вашего уровня знаний, предварительная обработка —..

Предварительная обработка данных и проверка модели без утечки данных
Предварительная обработка данных и проверка модели без утечки данных Исследователи данных понимают, что одной из самых больших угроз производительности наших моделей является утечка данных. Утечка данных происходит всякий раз, когда наши модели получают данные, которых нет в наборе обучающих данных. Иногда мы непреднамеренно помогаем обучению модели информацией, которую нельзя получить только из данных обучения, и в итоге получаем слишком радужную оценку точности нашей модели...

Представляем Скиппу
SciKIt-learn Конвейеры предварительной обработки в Pandas Краткое содержание Любой специалист по данным, вероятно, знаком с pandas и scikit-learn . Обычный рабочий процесс включает в себя очистку данных в pandas, дальнейшую предварительную обработку с использованием либо снова pandas , либо scikit-learn преобразователей, таких как StandardScaler , OneHotEncoder и т. д., после чего подгоняется алгоритм машинного обучения (что-то из scikit-learn снова). Теперь есть..

ОБРАБОТКА ПРИЗНАКОВ МОДЕЛИ ML
ОБРАБОТКА ПРИЗНАКОВ МОДЕЛИ ML Использование scikit-learn В машинном обучении всякий раз, когда у нас есть данные, мы будем сталкиваться со многими функциями и выбросами, которые могут не иметь большого значения для целевой переменной, это может привести к переоснащению модели и приведет к меньшей точности тестовых данных всякий раз, когда у нас есть данные в Нашими руками мы сначала пытаемся выбрать лучшие функции и удалить выбросы, что помогает нам повысить точность. Таким образом, мы..