mysql按10分钟,分组统计数据,如何统计

mysql按10分钟,分组统计数据,如何统计,第1张

234567891011121314 -- time_str '2016-11-20 04:31:11'-- date_str 20161120 select concat(left(date_format(time_str, '%y-%m-%d %h:%i'),15),'0') as time_flag, count(*) as count from `security`.`cmd_info` where `date_str`=20161120 group by time_flag order by time_flag-- 127 rows select round(unix_timestamp(time_str)/(10 * 60)) as timekey, count(*) from `security`.`cmd_info` where `date_str`=20161120 group by timekey order by timekey-- 126 rows -- 以上2个SQL语句的思路类似——使用「group by」进行区分,但是方法有所不同,前者只能针对10分钟(或1小时)级别,后者可以动态调整间隔大小,两者效率差不多,可以根据实际情况选用 select concat(date(time_str),' ',hour(time_str),':',round(minute(time_str)/10,0)*10), count(*) from `security`.`cmd_info` where `date_str`=20161120 group by date(time_str), hour(time_str), round(minute(time_str)/10,0)*10-- 145 rows select concat(date(time_str),' ',hour(time_str),':',floor(minute(time_str)/10)*10), count(*) from `security`.`cmd_info` where `date_str`=20161120 group by date(time_str), hour(time_str), floor(minute(time_str)/10)*10-- 127 rows (和 date_format 那个等价)

可以写出从数据上可以直观看出分组的sql, 另外对于"分组的时间间隔小于30分钟"这句话可能引申出两种理解:

数据先按时间排序, 只要相邻数据DEAL_TIME在30分钟以内则归组, 比如2019-06-06 13:00:00, 2019-06-06 13:05:00和2019-06-06 13:32:00可以归为一组

数据先按时间排序, 对于理解1的3条数据, 此时2019-06-06 13:32:00和2019-06-06 13:00:00的间隔超过30分钟, 需要另起一组

对于上述两个理解我这边都给出例子, 原理和MySql的rownumber实现有些类似, 排序后加上条件滚动计算, 方案有不足的地方, 1是多一层排序嵌套子查询, 2是结果如果不再嵌套会多出计算过程列

以下为代码:

-- by sleest 2019/06/06 临近分组

-- 制造临时表数据用于验证

DROP TEMPORARY TABLE IF EXISTS TMP_DEAL_TIME

CREATE TEMPORARY TABLE TMP_DEAL_TIME(DEAL_TIME DATETIME) AS

SELECT DATE_ADD(CURDATE(), INTERVAL 600 * RAND() MINUTE) AS DEAL_TIME

   FROM (SELECT 1 UNION ALL SELECT 2 UNION SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) A,

        (SELECT 1 UNION ALL SELECT 2 UNION SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) B

-- 查看临时表数据

SELECT DEAL_TIME FROM TMP_DEAL_TIME ORDER BY DEAL_TIME

-- 理解1: 只要相邻时间为指定分钟数以内则聚合

SELECT DEAL_TIME, 

       CASE WHEN @lastDealTime IS NULL THEN @minLevel:=1

            WHEN DEAL_TIME > DATE_ADD(@lastDealTime, INTERVAL 30 MINUTE) 

              THEN @minLevel:=@minLevel+1 END AS COMPUT_CONDITION,

              

       @lastDealTime:=DEAL_TIME AS LAST_DEAL_TIME,

       @minLevel AS GROUP_LEVEL

  FROM (SELECT DEAL_TIME FROM TMP_DEAL_TIME ORDER BY DEAL_TIME) E,

       (SELECT @lastDealTime:=NULL) F,

       (SELECT @minLevel:=0) G

-- 理解2: 只和开始聚合的第一条时间比较, 只有当该条数据处在聚合第一条指定分钟数以内才归组

SELECT DEAL_TIME, 

       CASE WHEN @lastDealTime IS NULL THEN @minLevel:=1

            WHEN DEAL_TIME > DATE_ADD(@lastDealTime, INTERVAL 30 MINUTE) 

              THEN @minLevel:=@minLevel+1 END AS COMPUT_CONDITION,

              

       CASE WHEN @lastDealTime IS NULL THEN @lastDealTime:=DEAL_TIME

            WHEN DEAL_TIME > DATE_ADD(@lastDealTime, INTERVAL 30 MINUTE)

              THEN @lastDealTime:=DEAL_TIME END AS LAST_DEAL_TIME,

       @minLevel AS GROUP_LEVEL

  FROM (SELECT DEAL_TIME FROM TMP_DEAL_TIME ORDER BY DEAL_TIME) E,

       (SELECT @lastDealTime:=NULL) F,

       (SELECT @minLevel:=0) G

对于理解1的执行结果如下:

对于理解2的执行结果如下:

后续可以根据结果中的GROUP_LEVEL进行分组显示


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/7478071.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-06
下一篇 2023-04-06

发表评论

登录后才能评论

评论列表(0条)

保存