option 1
indicator=True
A.merge(B, on='client_id', how='right', indicator=True) .query('_merge == "right_only"').drop('_merge', 1)
setup
A = pd.Dataframe(dict(client_id=[1, 2, 3], valueA=[4, 5, 6]))B = pd.Dataframe(dict(client_id=[3, 4, 5], valueB=[7, 8, 9]))
results
更多说明
indicator=True在合并结果中添加了另一列,该列
指示行结果是来自左侧,右侧还是两者。
A.merge(B, on='client_id', how='outer', indicator=True)
因此,我只是query用来过滤right_only指标,然后删除该列。
选项2
并不是真正的合并。您可以query再次使用来仅拉出 其不在B其中的行’client_id’A
B.query('client_id not in @A.client_id')
or an equivalent way of saying the same thing (but faster)
B[~B.client_id.isin(A.client_id)]
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)