Публикации по теме 'kaggle'


Использование наборов данных Kaggle с Google Colab
Мы все знаем, что Google продолжает предлагать наилучшие решения для большинства наших проблем. Одной из таких вещей является блокнот Google Colab. В этих ноутбуках используются облачные серверы Google, и они предлагают графический процессор, а также среду выполнения TPU [и все это бесплатно! Спасибо Google :)]. Всем энтузиастам машинного обучения, машинного обучения и искусственного интеллекта обязательно стоит попробовать ноутбуки Colab. Давайте начнем Не забудьте..

Почему я не смог завершить табличное соревнование Kaggle за декабрь 2021 года
С тяжелым сердцем я должен признаться, что мне не удалось завершить финальное табличное соревнование Kaggle за декабрь 2021 года. Причина этого в том, что в наборе данных поезда было 4 000 000 примеров и метка мультикласса только с одним номером 5. Поскольку набор данных о поездах был таким большим, система несколько раз давала мне сбои. Пока…

Эффективная предварительная обработка данных в машинном обучении: оптимизируйте рабочий процесс с помощью scikit-learn…
Вы когда-нибудь задумывались, почему так много фрагментов кода машинного обучения на Kaggle упускают из виду один из самых мощных инструментов в арсенале scikit? Пришло время пролить свет на часто игнорируемый, но очень эффективный метод использования конвейеров scikit для бесшовной предварительной обработки данных и моделирования. Во-первых, давайте рассмотрим важную роль предварительной обработки данных в машинном обучении. Независимо от вашего уровня знаний, предварительная обработка —..

Руководство для начинающих по проблеме Титаника Kaggle
Поскольку это мой первый пост, вот краткое описание того, чем я занимался: Я разработчик программного обеспечения, ставший энтузиастом данных. Недавно я начал изучать мельчайшие подробности науки о данных. Одна из самых серьезных проблем, когда я начал учиться через видео и курсы на таких сайтах, как Udemy, Coursera и т. Д., Это сделало меня пассивным, и я стал больше слушать, а не делать . У меня не было практики, хотя я мог понять большую часть теории. В этот момент я наткнулся..

Бинарная классификация
Быть или не быть: вот в чем вопрос Введение Двоичная классификация, как следует из названия, представляет собой задачу классификации элементов в один из двух классов/групп. Некоторые приложения бинарной классификации: Тестирование, есть ли у человека конкретное заболевание или нет Классификация электронной почты как спам или не спам Обнаружение мошенничества с кредитными картами и т. д. Это форма обучения с учителем , где Учитывая набор наблюдений Модель должна быть обучена..

Выжить на RMS Титаник: краткое изложение
Основные моменты того, что потребовалось, чтобы выжить на тонущем корабле, и что определило выживание в двух словах Обзор 15 апреля 1912 года «Титаник» затонул в пучине Атлантического океана. Этот могучий корабль путешествовал из Саутгемптона, Англия, в Нью-Йорк с 2224 душами, и случилось немыслимое — столкновение с айсбергом. Без достаточного количества спасательных шлюпок, чтобы спасти всех пассажиров и команду на борту, погибло более 1500 человек. В задаче Kaggle Титаник —..

Использование Kaggle для работы в области анализа данных.
Использование Kaggle для работы в области анализа данных. Прекратите запускать нейронные сети на своем маленьком ноутбуке! Как специалисты по обработке данных, все мы любим Jupyter Notebook. Но наступает время, когда вы работаете с очень большим набором данных и / или сложной моделью, и ваш компьютер просто не справляется с этим. Хорошей новостью является то, что вы можете взять свой файл Jupyter Notebook и импортировать его в Kaggle. Если вы новичок в науке о данных, Kaggle - это..