利用的新的非等额连接功能,这是可行的方法
data.table。
dt[dt[ , .(date3=date, date2 = date - 2, email)], on = .(date >= date2, date<=date3), allow.cartesian = TRUE ][ , .(count = uniqueN(email)), by = .(date = date + 2)]# date V1# 1: 2011-12-30 3# 2: 2011-12-31 3# 3: 2012-01-01 3# 4: 2012-01-02 3# 5: 2012-01-03 1# 6: 2012-01-04 2
老实说,我对它的工作方式有点不满意,但是我的想法是加入
dt进来
date,匹配
date两天前到今天之间的任何东西。我不确定为什么我们必须在
date= date + 2事后进行清理。
这是一种使用键的方法:
setkey(dt, date)dt[ , .(count = dt[.(seq.Date(.BY$date - 2L, .BY$date, "day")), uniqueN(email), nomatch = 0L]), by = date]
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)