这几乎是您的数据框(我避免了复制日期):
df = pd.Dataframe({ 'col1': [1, 1, 1, 2, 2, 2], 'col2': [1, 2, 3, 1, 2, 3], 'date': [1, 9, 10, 10, 10, 25]})
以此定义:
def max_diff_date(g): g = g.sort(columns=['date']) return g.col2.ix[(g.date.ix[1: ] - g.date.shift(1)).argmax() - 1]
你有:
>> df.groupby(df.col1).apply(max_diff_date)col11 12 2dtype: int64
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)