Pandas мультииндексная логическая индексация

Итак, учитывая мультииндексированный фрейм данных, я хотел бы возвращать только строки, которые удовлетворяют условию для всех уровней нижнего индекса в мультииндексе. Вот небольшой рабочий пример:

df = pd.DataFrame({'a': [1, 1, 2, 2], 'b': [1, 2, 3, 4], 'c': [0, 2, 2, 2]})
df = df.set_index(['a', 'b'])

print(df)

вне:

Теперь я хотел бы вернуть записи, для которых c > 1. Например, я хотел бы сделать что-то вроде

df[df[c > 1]]

вне:

Но я хочу получить

вне:

Любые мысли о том, как сделать это наиболее эффективным способом?

pdevar 20.10.2015 источник

comment

Вы имеете в виду c›1 и a=2? - Zero 20.10.2015

comment

Да, но я не хочу указывать a == 2. Это просто игрушечный пример. - pdevar 20.10.2015

comment

Можете ли вы уточнить, что вы спрашиваете? Я не понимаю, почему то, что вы просите, не соответствует тому, что вы получаете с df[df[c > 1]]? - ako 21.10.2015

comment

Я хочу, чтобы индекс a доминировал, поэтому, если какая-либо из записей с уникальным значением a, в данном случае a==2, имеет соответствующее значение c, такое что c>1, тогда удаляются все записи, связанные с этим значением индекса a. Итак, что-то вроде `df[df[c › 1 for all a == x] for all x in a] . - pdevar 21.10.2015

Ответы (1)

arrow_upward
0
arrow_downward

В итоге я использовал groupby:

df.groupby(level=0).filter(lambda x: all([c > 1 for v in x['c']]))

pdevar 21.10.2015

Pandas мультииндексная логическая индексация

Ответы (1)

Вопросы по теме