
GROUP BY 语句根据一个或多个列对结果集进行分组。在分组的列上我们可以使用 COUNT, SUM, AVG,等函数。
具体语法参考:
from 树懒学堂 - 一站式数据知识平台
可以写出从数据上可以直观看出分组的sql, 另外对于"分组的时间间隔小于30分钟"这句话可能引申出两种理解:
数据先按时间排序, 只要相邻数据DEAL_TIME在30分钟以内则归组, 比如2019-06-06 13:00:00, 2019-06-06 13:05:00和2019-06-06 13:32:00可以归为一组
数据先按时间排序, 对于理解1的3条数据, 此时2019-06-06 13:32:00和2019-06-06 13:00:00的间隔超过30分钟, 需要另起一组
对于上述两个理解我这边都给出例子, 原理和MySql的rownumber实现有些类似, 排序后加上条件滚动计算, 方案有不足的地方, 1是多一层排序嵌套子查询, 2是结果如果不再嵌套会多出计算过程列
以下为代码:
-- by sleest 2019/06/06 临近分组-- 制造临时表数据用于验证
DROP TEMPORARY TABLE IF EXISTS TMP_DEAL_TIME
CREATE TEMPORARY TABLE TMP_DEAL_TIME(DEAL_TIME DATETIME) AS
SELECT DATE_ADD(CURDATE(), INTERVAL 600 * RAND() MINUTE) AS DEAL_TIME
FROM (SELECT 1 UNION ALL SELECT 2 UNION SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) A,
(SELECT 1 UNION ALL SELECT 2 UNION SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) B
-- 查看临时表数据
SELECT DEAL_TIME FROM TMP_DEAL_TIME ORDER BY DEAL_TIME
-- 理解1: 只要相邻时间为指定分钟数以内则聚合
SELECT DEAL_TIME,
CASE WHEN @lastDealTime IS NULL THEN @minLevel:=1
WHEN DEAL_TIME > DATE_ADD(@lastDealTime, INTERVAL 30 MINUTE)
THEN @minLevel:=@minLevel+1 END AS COMPUT_CONDITION,
@lastDealTime:=DEAL_TIME AS LAST_DEAL_TIME,
@minLevel AS GROUP_LEVEL
FROM (SELECT DEAL_TIME FROM TMP_DEAL_TIME ORDER BY DEAL_TIME) E,
(SELECT @lastDealTime:=NULL) F,
(SELECT @minLevel:=0) G
-- 理解2: 只和开始聚合的第一条时间比较, 只有当该条数据处在聚合第一条指定分钟数以内才归组
SELECT DEAL_TIME,
CASE WHEN @lastDealTime IS NULL THEN @minLevel:=1
WHEN DEAL_TIME > DATE_ADD(@lastDealTime, INTERVAL 30 MINUTE)
THEN @minLevel:=@minLevel+1 END AS COMPUT_CONDITION,
CASE WHEN @lastDealTime IS NULL THEN @lastDealTime:=DEAL_TIME
WHEN DEAL_TIME > DATE_ADD(@lastDealTime, INTERVAL 30 MINUTE)
THEN @lastDealTime:=DEAL_TIME END AS LAST_DEAL_TIME,
@minLevel AS GROUP_LEVEL
FROM (SELECT DEAL_TIME FROM TMP_DEAL_TIME ORDER BY DEAL_TIME) E,
(SELECT @lastDealTime:=NULL) F,
(SELECT @minLevel:=0) G
对于理解1的执行结果如下:
对于理解2的执行结果如下:
后续可以根据结果中的GROUP_LEVEL进行分组显示
上一篇聚合函数末尾处使用了GROUP BY,但没有做具体的介绍,这一篇就主要介绍一下GROUP BY的使用方法。顺便介绍一下对分组查询的过滤关键词HAVING的用法。
在MySQL中,GROUP BY关键词可以根据一个或多个字段对查询结果进行分组,类似于Excel中的数据透视表。可以单独使用,但一般情况下都是结合聚合函数来使用的。
语法格式如下:
下面演示都是基于这一张简单的省份对应大区的表格。
【单独使用GROUP BY】
单独使用GROUP BY关键字时,查询结果会只显示每个分组的第一条记录。
根据省份表里面的大区进行聚合,查询全国共分成了几个大区,SQL语句如下↓
【GROUP BY结合聚合函数】
5个聚合函数上一篇已经详细介绍了用法,GROUP BY和聚合函数结合使用也是最频繁的,下面就继续使用省份表来求每个大区有多少个省份,对应的聚合函数就是COUNT函数,SQL语句如下↓
【GROUP BY结合GROUP_CONCAT】
这还是一个很有用的功能,GROUP_CONCAT() 函数会把每个分组的字段值都合并成一行显示出来。
下面继续使用省份表,把每个大区对应的省份放在一行展示,用分号分开,SQL语句如下↓
【GROUP BY结合WITH ROLLUP】
WITH POLLUP关键词用来在所有记录的最后加上一条记录,这条记录是上面所有记录的总和,SQL语句如下↓
【GROUP BY结合HAVING】
在MySQL中,可以使用HAVING关键字对分组后的数据进行过滤。
使用 HAVING 关键字的语法格式如下:
HAVING关键词和WHERE关键词都可以用来过滤数据,且HAVING支持WHERE关键词中所有的 *** 作符和语法。但是WHERE和HAVING关键字也存在以下几点差异:
下面筛选一下省份数量在7个及以上的大区,SQL语句如下↓
【GROUP BY结合ORDER BY】
聚合后的数据,一半情况下也是需要进行排序的,通过ORDER BY对聚合查询结果进行排序,对省份数量按从大到小进行排序,SQL语句如下↓
End
◆ PowerBI开场白
◆ Python高德地图可视化
◆ Python不规则条形图
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)