Публикации по теме sklearn

Публикации по теме 'sklearn'

Мой первый опыт работы с ядрами Kaggle

Когда я играю на Kaggle, я обычно выбираю Python и S klearn . Обычно по умолчанию для написания кода используется блокнот J upyter , но сейчас я решил впервые попробовать ядра kaggle . Создать новое ядро довольно просто. Все, что вам нужно сделать, это выбрать соревнование, щелкнуть подменю «Ядра» и затем щелкнуть «Новое ядро». Как видно на картинке выше, я выбрал всем известное Соревнование Титаник . После того, как вы нажмете кнопку «Новое ядро», у вас будет возможность..

Что такое конвейер в машинном обучении? Как его создать?

Машинное обучение является важным аспектом современных вычислений, а с появлением Интернета оно стало важнее, чем когда-либо. Существует множество доступных инструментов, которые можно использовать для реализации алгоритмов машинного обучения, но ни один из них не является настолько всеобъемлющим и простым в использовании, как библиотека Scikit-learn. Одной из важнейших особенностей Scikit-learn является функциональность конвейера, которая позволяет нам объединять несколько различных..

Как использовать sklearn для преобразования перекошенной надписи в наборе данных

Одна вещь, которую я обнаружил, пройдя курс "Введение в машинное обучение" от Udacity и 30-дневный курс машинного обучения Kaggle, заключается в том, что они, как правило, просматривают много одного и того же материала, в то время как я надеялся узнать что-то новое в каждом курсе. Частично это может быть связано с тем, что один из людей, который работает в Kaggle, также работает в Udacity, поэтому неизбежно, что многие материалы, используемые в Udacity, также будут использоваться в..

Сколько гиперпараметров следует тестировать при каждом запуске поиска по сетке?

Количество гиперпараметров, которые вы должны тестировать при каждом запуске поиска по сетке, зависит от нескольких факторов, включая сложность вашей модели, объем доступных данных и вычислительные ресурсы, которыми вы располагаете. Вот несколько общих рекомендаций, которые следует учитывать при определении количества тестируемых гиперпараметров: Начните с небольшого количества гиперпараметров. Когда вы только начинаете поиск по сетке, рекомендуется начинать с небольшого количества..

Введение в линейную регрессию в Python с использованием Sklearn

Введение В предыдущей статье мы узнали о линейной регрессии в машинном обучении и ее приложениях. В этой статье мы собираемся погрузиться немного глубже и изучить, как алгоритм линейной регрессии в sklearn можно реализовать с помощью Python. Линейная регрессия — это мощный и широко используемый статистический метод для моделирования отношений между зависимой переменной и одной или несколькими независимыми переменными. Он обеспечивает простой, но эффективный способ понять и..

Kaggle Competition: Donors Choose Application Screening — логистическая регрессия TFIDF для начинающих

В своих последних двух статьях я работал над учебниками по tensorflow, это отлично подходит для быстрого ознакомления с ML, но не так хорошо для развития более глубокой интуиции. Итак, сегодня я попытаюсь построить алгоритм машинного обучения с нуля, и я выбрал старый конкурс Kaggle. Цель этого конкурса - предсказать, будет ли проект одобрен для финансирования, учитывая описание проекта. Если вы не знакомы с Kaggle, это сайт для задач машинного обучения. Вам предоставляется набор..

3 способа выполнить обнаружение выбросов в 3 строках кода Python

Простые способы обнаружения выбросов в вашем наборе данных, которые требуют не слишком много строк кода. Если вы новичок в науке о данных, машинном обучении и т. д., вот 3 очень простых способа обнаружить выбросы в вашем наборе данных, которые не требуют слишком много строк кода. Наш тестовый набор данных data = pd.DataFrame([ [87, 82, 85], [81, 89, 75], [86, 87, 69], [91, 79, 86], [88, 89, 82], [0, 0, 0], # this guy missed the exam [100, 100, 100], ],..