Публикации по теме kaggle-competition

Публикации по теме 'kaggle-competition'

Максимизация эффективности в соревнованиях Kaggle с пакетом Python kaggle_util

Вы устали тратить часы на настройку каталогов, загрузку наборов данных, отправку результатов и просмотр таблицы лидеров, участвуя в соревнованиях Kaggle? kaggle_util здесь, чтобы помочь вам со всеми вашими проблемами, связанными с Kaggle! kaggle_util — это пакет Python, предоставляющий набор служебных функций для работы с наборами данных и соревнованиями Kaggle. С kaggle_util вы можете легко настроить каталоги своих проектов, загрузить наборы данных, отправить свои результаты и..

Mercedes-Benz Greener Manufacturing Kaggle Competition

1. Введение 2. Бизнес-проблема 3. Источник данных 4. Подход машинного обучения 5. Показатели производительности 6. Существующие подходы к проблеме 7. Исследовательский анализ данных 8. Решение для первого разреза 9. Объяснение модели 10. Сравнение моделей 11. Будущая работа 12. Ссылки Введение: Kaggle проводит конкурс экологичного производства Mercedes-Benz, в котором основное внимание уделяется заботе об окружающей среде при уменьшении парникового эффекта,..

Как принять участие в соревновании Titanic Kaggle?

Как начать с конкурса Kaggle? Привет, ребята, это новый тип статьи, которую я хочу начать. Это будет больше в формате документации, и это позволит мне поделиться с вами тем, как я решаю некоторые из проблем, опубликованных на Kaggle , и уроками, которые я усвоил, изучив на эти вызовы.

Соревнование Kaggle с изучением навыков машинного обучения (3) — Несбалансированный набор данных

Прежде чем приступить к разработке функций, я немного поработал над частью корреляции и рассмотрел некоторые методы обработки несбалансированного набора данных (например, целевых столбцов). Я хотел бы поделиться об этом, и это будет шанс пересмотреть то, что я изучил. Корреляция Чтобы проверить корреляцию между всеми функциями и целевыми столбцами, тепловая карта является хорошим приложением для наблюдения. Давайте сосредоточимся на коэффициенте между параметром признака...

Как максимально использовать модели машинного обучения

Уроки, которые я извлек из Kaggle, чтобы улучшить производительность окончательной модели. Включены плюсы и минусы каждой стратегии оценки, а также когда использовать каждую из них. Вступление Это отличная черта - учиться у других и начинать с того места, где они остановились. Кроме того, я признаю, что решение любой проблемы - это хорошо понять ее, а затем судить о различных решениях, пока не будет получено стабильное окончательное решение. С тех пор, как я начал свой аккаунт на..

Цены на жилье Продвинутые методы регрессии

В этой статье мы рассмотрим классическое соревнование Kaggle и изучим некоторые методы, которые помогут нам добиться лучшего результата в наших моделях более «автоматическим» способом. Вы можете найти более подробную информацию о наборе данных здесь , а полный блокнот jupyter — здесь . Импорт данных import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns from sklearn.impute import SimpleImputer from sklearn.preprocessing import OneHotEncoder..

Lightgbm для регрессии с категориальными данными.

В этом мы будем Понимание ЛГБМ Реализуйте его в наборе данных kaggle Плюсы и минусы Понимание ЛГБМ Все мы знаем, что для экспериментов с данными необходимо использовать методы градиентного усиления, и они также дают хорошие результаты. Они настолько популярны, что мы не можем их игнорировать. Но деревья, усиленные градиентом, имеют компромисс между точностью и эффективностью. Поскольку им необходимо сканировать целые данные, чтобы вычислить информационный прирост всех возможных..