Публикации по теме 'fillna'


Очистка данных в машинном обучении
Все, что вам нужно знать об очистке данных data.isnull().sum() dropna(axis=1) drop(features_list) data.select_dtypes(exclude=[features_list]) Используйте цикл for с условием if data.isnull().any() для очистки как тестовых, так и обучающих данных. Импутер from sklearn.impute import SimpleImputer my_imputer = SimpleImputer() filled_data = my_imputer.fit_transform(data) //on train data filled_data = my_imputer.transform(data) //on test data Расширение для импутера: работа с..

Вопросы по теме 'fillna'

панды обновляют определенную строку со значениями nan
Я просматривал, но я не могу найти ответ на мой конкретный вопрос. У меня есть Dataframe с сотнями столбцов и сотнями строк. Я хочу изменить встречающиеся значения NaN только для первой строки и заменить их пустой строкой. На это был дан ответ...
2737 просмотров
schedule 09.05.2023

Заполнение нулевых значений средним значением
Мне дан набор данных со многими значениями NaN, и я хотел заполнить нулевое значение средним значением каждого столбца. Итак, я попробовал следующий код: def fill_mean(): m = [df.columns.get_loc(c) for c in df.columns if c in missing]...
794 просмотров
schedule 06.09.2022

Кадр данных Pandas вперед заполняется распадом
Я использую Python 3.5 и Pandas v 0.19.2. У меня есть кадр данных, как показано ниже. Прямое заполнение пропущенных значений выполняется прямолинейно. import pandas as pd import numpy as np d = {'A': np.array([10, np.nan, np.nan, -3, np.nan, 4,...
993 просмотров
schedule 21.09.2022

Pandas: заполнять значения NaN строка за строкой по идентификатору группы
Я пытаюсь заполнить значения NaN строка за строкой в ​​соответствии с идентификатором группы. Я пробовал использовать fillNA, используя параметры прямого и обратного заполнения, но функция fillNA не заполняет фрейм данных строка за строкой. Кроме...
94 просмотров
schedule 09.05.2022

Fillna с обращенным вперед и назад условием в пандах
Я работаю с фреймом данных, в котором есть столбец с несколькими NaN, который я хочу заполнить в соответствии со следующим условием: если идти вперед и назад до 3 строк, есть 2 равных значения, затем заполните NaN этим значением. Поскольку это...
730 просмотров
schedule 28.10.2022

Как использовать функцию fillna со столбцом с периодом в pyspark
Я попытался запустить fillna, чтобы вставить nan в столбец со специальным символом. df = spark.createDataFrame( [(None, None), ('U1', None), ('U3', 1.0)], ['USER_ID', 'a.b'] ) Я попытался df = df.fillna({"`a.b`":...
719 просмотров

Python – заполнить NULL предыдущим значением записи в столбце
import pandas as pd df = pd.DataFrame([['NewJersy',0,'2020-08-29'], ['NewJersy',12,'2020-08-30'], ['NewJersy',12,'2020-08-31'], ['NewJersy',None,'2020-09-01'],...
73 просмотров
schedule 26.06.2023

Pandas .fillna() не работает с .sample()
У меня есть набор данных со столбцом state , уникальные значения которого состоят из ['released', 'isolated', 'deceased', nan] . Я попытался ввести недостающие данные, используя случайную выборку, например: for column in ['sex','state','city']:...
47 просмотров
schedule 07.02.2023

Заполнить столбцы значений nan предыдущим значением, умноженным на константу
У меня есть df с некоторыми столбцами, заканчивающимися несколькими значениями nan. Я хотел бы использовать fillna(method='ffill') или что-то подобное, чтобы умножить каждое значение nan col на предыдущее значение * некоторую константу из другого df....
43 просмотров
schedule 24.10.2022

заполнить пропущенные значения на основе последнего значения
Я хочу заполнить пропущенные значения на основе последнего значения каждого идентификатора например, я хочу эту базу данных id value 1 a 1 nan 1 nan 1 b 2 c 2 nan 2 nan 2 d to be id value 1 a 1...
16 просмотров
schedule 23.04.2023