Иногда при работе с наборами данных для задач машинного обучения можно обнаружить, что наборы данных, загруженные в Pandas DataFrame, содержат недостающие данные.

Здесь я привожу пример того, как создать фрейм данных pandas с отсутствующими данными и как 1) полностью удалить или опустить эти отсутствующие значения и их соответствующие столбцы или строки или 2) заполните их данными по вашему выбору.

Следующий код поможет нам понять, как это сделать.

Пропуск и удаление отсутствующих данных

Этот код создаст pandas DataFrame со следующей информацией.

Как видите, в этом наборе данных в настоящее время есть NaN. Давайте узнаем, как опускать столбцы или строки с пустыми ячейками или NaN.

Это приведет к появлению следующего DataFrame с пропущенными строками, в которых было найдено какое-либо NaN:

Теперь мы видим, как опустить столбцы с NaN:

Это приведет к появлению следующего DataFrame с пропущенными столбцами, в которых было найдено какое-либо NaN:

Обратите внимание, что dropna () не изменит содержимое DataFrame, он только перестанет отображать столбцы или строки, в которых было найдено NaN. Чтобы изменить DataFrame, необходимо использовать метод dropna (), например:

Заполнение отсутствующих данных

Чтобы заполнить недостающие данные в фрейме данных pandas, мы используем следующий метод:

В результате получится следующий DataFrame:

Итак, это все, что вам нужно сделать, чтобы иметь дело с пропущенными значениями! Обратите внимание, что значения, которые вы вводите, должны иметь смысл для набора данных, с которым вы имеете дело, поэтому я рекомендую использовать статистический метод, такой как среднее значение, стандартное отклонение и т. Д., Чтобы заполнить данные в соответствии с потребностями или требованиями вашего набора данных.

Если вам понравилось ❤❤️️ читать это, обязательно следите и 👏 тоже! Поделитесь этим с друзьями, семьей, да и со всеми специалистами по обработке данных, которых вы знаете! Ура !! 😄 🐵