Публикации по теме kaggle

Публикации по теме 'kaggle'

Начало работы с вашим первым соревнованием Kaggle

Понимание ценности данных Итак, вы решили рискнуть и принять участие в своем первом соревновании Kaggle. Поздравляем! Вы скоро получите ценный урок понимания ценности данных, изучения новых способов применения своих навыков и использования их для соперничества с лучшими умами мира. Но прежде чем вы броситесь в соревнование, есть несколько шагов, которые вы можете предпринять, чтобы убедиться, что вы готовы к успеху. Прочтите несколько советов о том, как подготовиться к вашему..

Как Feature Engineering может помочь вам преуспеть в соревновании Kaggle - Часть II

В первой части этой серии я представил Соревнование по машинному обучению Outbrain Click Prediction . В этом посте описывались некоторые предварительные и важные задачи науки о данных, такие как исследовательский анализ данных и разработка функций, выполняемая для соревнований с использованием кластера Spark, развернутого в Google Dataproc . В этом посте я описываю оценку конкуренции, дизайн моей стратегии перекрестной проверки и мои базовые модели с использованием статистических..

Космический корабль Титаник — Kaggle

Космический корабль Титаник — это конкурс Kaggle ML. Цель этого состоит в том, чтобы предсказать, какие пассажиры смогли перейти в другое измерение. В этом посте я объясню свой подход к решению этой проблемы. Так что, если вы готовы, пристегните ремни безопасности, чтобы начать это приключение. Но сначала давайте познакомимся с нашими пассажирами или набором данных : 8693 образца – пассажиры Функции: HomePlanet, CryoSleep, Cabin, Destination, Age, VIP, RoomService,..

Как создать автоматически обновляемый набор данных с открытым исходным кодом с помощью API Kaggle и действий GitHub

Руководство по созданию автоматически обновляемого набора данных с открытым исходным кодом с использованием Kaggle API и GitHub Actions. В этой статье мы увидим, как использовать любой веб-скребок или сборщик данных, который зависит от источника данных, который часто обновляется, запускать его каждый день с помощью GitHub Actions и обновлять наш набор данных, размещенный в Kaggle. Вы когда-нибудь сталкивались с интересным источником данных, который, по вашему мнению, может быть..

Приложения и преимущества предварительно обученной модели - собаки KaggleVSCats

Для задач распознавания изображений отлично подходят предварительно обученные модели. Во-первых, их проще использовать, поскольку они предоставляют архитектуру «бесплатно». Кроме того, они обычно показывают лучшие результаты и требуют меньшего обучения. Чтобы увидеть реальное применение этой теории, я буду использовать набор данных CatVSDogs от Kaggle, чтобы попытаться обсудить результаты использования различных методов. Шаги будут следующими: 1) Imports 2) Download and Unzip..

Как стать гроссмейстером Kaggle

В этой статье мы выделяем некоторые ключевые выводы из презентации Дэвида Остина о том, как гроссмейстер Kaggle повышает производительность своего решения на саммите SigOpt. Дэвид Остин — старший главный инженер по искусственному интеллекту в Intel, работающий над промышленными приложениями в сфере Интернета вещей. В свободное время он, по его собственным словам, проводит слишком много времени, участвуя в соревнованиях Kaggle, и с 2018 года имеет звание гроссмейстера. Фон В..

Состояние науки о данных и машинного обучения

«Наука о данных отвечает на вопросы, которые существуют независимо от науки о данных» - Хьюго Боун-Андерсон. Введение Наука о данных, машинное обучение, глубокое обучение, искусственный интеллект - новые дисциплины, связанные с художественной литературой. Когда я впервые начал переход в сферу науки о данных от традиционной разработки программного обеспечения, я столкнулся с множеством проблем и у меня было много вопросов: стоит ли мне вернуться в школу? Что лучше: MOOC или..