Первое свидание с машинным обучением

Понимание предварительной обработки данных

Я подумал о машинном обучении знакомств в личных интересах. Как новичку, я бы порекомендовал вам начать с предварительной обработки данных. В этой статье я познакомлю вас с инструментами предварительной обработки данных.

Давай попробуем ...

В последние несколько дней я познакомился с новым языком, который называется R и буквально связан с его родным братом, Python.

Если у вас есть опыт работы с машинным обучением, вам не повредит использование Jupytor Notebook или Spyder или, возможно, вашего классического терминала. Во-первых, вам нужно будет подготовиться к установке платформы Anaconda на ваш компьютер. Фактически, здесь я использую формат файла .ipynb для реализации в будущих статьях. Эта первая статья призвана познакомить вас с машинным обучением и начать свой путь как новичок. В следующих статьях вы познакомитесь с реализациями.

Easy Peasy Lemon Squeezy…!

Пропуская все эти проблемы, такие как импорт библиотек и вопросы версии, вы можете просто избавиться от них с помощью Google Colab. Google Colab позволяет вам играть с ML без предварительной установки, и вам понадобится только хорошее подключение к Интернету, чтобы быстро получать предложения по кодированию. Это арахис ...

Что в предварительной обработке данных?

Если вы новичок в машинном обучении в своей карьере, вы обязательно столкнетесь с отсутствием данных, которые вам не понравятся. В следующей статье я покажу вам, как работать с отсутствующими данными с помощью реализаций.

В качестве следующего шага важно узнать о кодировании категориальных данных в зависимости от независимой или зависимой переменной. Более того, вы узнаете, как выбрать зависимую переменную или независимую переменную, просмотрев набор данных.

Следующим шагом является разделение набора данных на обучающий набор и тестовый набор. И это очень важно, поскольку каждый раз, когда вы хотите обучить свою модель машинного обучения, вы должны создавать два отдельных набора, как показано выше. В обучающем наборе вы собираетесь обучить модель машинного обучения понимать корреляции внутри вашего набора данных, а с помощью тестового набора вы собираетесь оценить свою модель машинного обучения. Набор тестов, который мы собираемся реализовать на новых данных, которые модель не обучила. В основном наблюдения.

Обратите внимание, что…

если ваша модель машинного обучения слишком хорошо обучена на обучающем наборе, поэтому она не работает на новых наблюдениях.

Итак, первое свидание с ML почти закончилось ...

В конце концов, в следующей статье будет обсуждаться реализация масштабирования функций для масштабирования всех ваших функций, чтобы убедиться, что они находятся в правильном масштабе.

Чтобы заинтересовать вас машинным обучением…