У меня есть данные примерно с 1500 столбцами (функциями) и 900 строками данных. Я использую это для удаления значений, имеющих среднее значение менее 80%.
df1 = df.columns[df.isnull().mean() < .8]
Но, тем не менее, мой оставшийся набор данных содержит столбцы, содержащие около 6000 нулевых значений. Какой метод лучше всего использовать для удаления нулевых значений? Пожалуйста, направляйте. И было бы полезно вменять значения в такое большое количество нулевых значений? И я должен удалить нулевые значения при каком пороге? какой из них лучше? Например, у меня есть функции с пропущенными значениями 100 250 1500 2000 3500 4000 6000. нужна ваша инструкция помогите пожалуйста