如unutbu的评论中所述,groupby的过滤器等效于SQL的HAVINg:
In [11]: df = pd.Dataframe([[1, 2], [1, 3], [5, 6]], columns=['A', 'B'])In [12]: dfOut[12]: A B0 1 21 1 32 5 6In [13]: g = df.groupby('A') # GROUP BY AIn [14]: g.filter(lambda x: len(x) > 1) # HAVINg COUNT(*) > 1Out[14]: A B0 1 21 1 3
您可以编写更复杂的函数(将这些函数应用于每个组),只要它们返回简单的布尔值即可:
In [15]: g.filter(lambda x: x['B'].sum() == 5)Out[15]: A B0 1 21 1 3
注意:
可能存在一个错误,即您无法编写函数来对过去用于分组的列进行 *** 作…解决方法是手动对列进行分组g= df.groupby(df['A']))
。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)