Публикации по теме 'kaggle-competition'
Максимизация эффективности в соревнованиях Kaggle с пакетом Python kaggle_util
Вы устали тратить часы на настройку каталогов, загрузку наборов данных, отправку результатов и просмотр таблицы лидеров, участвуя в соревнованиях Kaggle? kaggle_util здесь, чтобы помочь вам со всеми вашими проблемами, связанными с Kaggle!
kaggle_util — это пакет Python, предоставляющий набор служебных функций для работы с наборами данных и соревнованиями Kaggle. С kaggle_util вы можете легко настроить каталоги своих проектов, загрузить наборы данных, отправить свои результаты и..
Mercedes-Benz Greener Manufacturing Kaggle Competition
1. Введение
2. Бизнес-проблема
3. Источник данных
4. Подход машинного обучения
5. Показатели производительности
6. Существующие подходы к проблеме
7. Исследовательский анализ данных
8. Решение для первого разреза
9. Объяснение модели
10. Сравнение моделей
11. Будущая работа
12. Ссылки
Введение:
Kaggle проводит конкурс экологичного производства Mercedes-Benz, в котором основное внимание уделяется заботе об окружающей среде при уменьшении парникового эффекта,..
Как принять участие в соревновании Titanic Kaggle?
Как начать с конкурса Kaggle?
Привет, ребята, это новый тип статьи, которую я хочу начать. Это будет больше в формате документации, и это позволит мне поделиться с вами тем, как я решаю некоторые из проблем, опубликованных на Kaggle , и уроками, которые я усвоил, изучив на эти вызовы.
Соревнование Kaggle с изучением навыков машинного обучения (3) — Несбалансированный набор данных
Прежде чем приступить к разработке функций, я немного поработал над частью корреляции и рассмотрел некоторые методы обработки несбалансированного набора данных (например, целевых столбцов). Я хотел бы поделиться об этом, и это будет шанс пересмотреть то, что я изучил.
Корреляция
Чтобы проверить корреляцию между всеми функциями и целевыми столбцами, тепловая карта является хорошим приложением для наблюдения.
Давайте сосредоточимся на коэффициенте между параметром признака...
Как максимально использовать модели машинного обучения
Уроки, которые я извлек из Kaggle, чтобы улучшить производительность окончательной модели. Включены плюсы и минусы каждой стратегии оценки, а также когда использовать каждую из них.
Вступление
Это отличная черта - учиться у других и начинать с того места, где они остановились. Кроме того, я признаю, что решение любой проблемы - это хорошо понять ее, а затем судить о различных решениях, пока не будет получено стабильное окончательное решение.
С тех пор, как я начал свой аккаунт на..
Цены на жилье Продвинутые методы регрессии
В этой статье мы рассмотрим классическое соревнование Kaggle и изучим некоторые методы, которые помогут нам добиться лучшего результата в наших моделях более «автоматическим» способом.
Вы можете найти более подробную информацию о наборе данных здесь , а полный блокнот jupyter — здесь .
Импорт данных
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import OneHotEncoder..
Lightgbm для регрессии с категориальными данными.
В этом мы будем
Понимание ЛГБМ Реализуйте его в наборе данных kaggle Плюсы и минусы
Понимание ЛГБМ
Все мы знаем, что для экспериментов с данными необходимо использовать методы градиентного усиления, и они также дают хорошие результаты. Они настолько популярны, что мы не можем их игнорировать. Но деревья, усиленные градиентом, имеют компромисс между точностью и эффективностью. Поскольку им необходимо сканировать целые данные, чтобы вычислить информационный прирост всех возможных..