Допустим, я создаю некоторые данные, а затем создаю ячейки разных размеров:
from __future__ import division
x = np.random.rand(1,20)
new, = np.digitize(x,np.arange(1,x.shape[1]+1)/100)
new_series = pd.Series(new)
print(new_series.value_counts())
показывает:
20 17
16 1
4 1
2 1
dtype: int64
В основном я хочу преобразовать базовые данные, если я установлю минимальный порог не менее 2 на бин, так что new_series.value_counts()
будет следующим:
20 17
16 3
dtype: int64
groupby
сfilter
:df.groupby('some_col').filter(lambda x: len(x) < threshold)
- person EdChum   schedule 26.07.2016x
— это ваши данные, аnew
— ваши ячейки, они не перекрываются,x
— это массив десятичных знаков, аnew
— это массив целых чисел. Является лиnew
размером корзины? Так где же стартовые границы? - person tmthydvnprt   schedule 26.07.2016