R的滚动日期范围内的唯一值计数

R的滚动日期范围内的唯一值计数,第1张

R的滚动日期范围内的唯一值计数

利用的新的非等额连接功能,这是可行的方法

data.table

dt[dt[ , .(date3=date, date2 = date - 2, email)],    on = .(date >= date2, date<=date3),    allow.cartesian = TRUE   ][ , .(count = uniqueN(email)),       by = .(date = date + 2)]#          date V1# 1: 2011-12-30  3# 2: 2011-12-31  3# 3: 2012-01-01  3# 4: 2012-01-02  3# 5: 2012-01-03  1# 6: 2012-01-04  2

老实说,我对它的工作方式有点不满意,但是我的想法是加入

dt
进来
date
匹配
date
两天前到今天之间的任何东西。我不确定为什么我们必须在
date= date + 2
事后进行清理。


这是一种使用键的方法:

setkey(dt, date)dt[ , .(count = dt[.(seq.Date(.BY$date - 2L, .BY$date, "day")),        uniqueN(email), nomatch = 0L]), by = date]


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5058338.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-16
下一篇 2022-11-16

发表评论

登录后才能评论

评论列表(0条)

保存