MySQL 怎样分组查询

MySQL 怎样分组查询,第1张

MySQL GROUP BY 子句

GROUP BY 语句根据一个或多个列对结果集进行分组。在分组的列上我们可以使用 COUNT, SUM, AVG,等函数

具体语法参考:

from 树懒学堂 - 一站式数据知识平台

可以写出从数据上可以直观看出分组的sql, 另外对于"分组的时间间隔小于30分钟"这句话可能引申出两种理解:

数据先按时间排序, 只要相邻数据DEAL_TIME在30分钟以内则归组, 比如2019-06-06 13:00:00, 2019-06-06 13:05:00和2019-06-06 13:32:00可以归为一组

数据先按时间排序, 对于理解1的3条数据, 此时2019-06-06 13:32:00和2019-06-06 13:00:00的间隔超过30分钟, 需要另起一组

对于上述两个理解我这边都给出例子, 原理和MySql的rownumber实现有些类似, 排序后加上条件滚动计算, 方案有不足的地方, 1是多一层排序嵌套子查询, 2是结果如果不再嵌套会多出计算过程列

以下为代码:

-- by sleest 2019/06/06 临近分组

-- 制造临时表数据用于验证

DROP TEMPORARY TABLE IF EXISTS TMP_DEAL_TIME

CREATE TEMPORARY TABLE TMP_DEAL_TIME(DEAL_TIME DATETIME) AS

SELECT DATE_ADD(CURDATE(), INTERVAL 600 * RAND() MINUTE) AS DEAL_TIME

   FROM (SELECT 1 UNION ALL SELECT 2 UNION SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) A,

        (SELECT 1 UNION ALL SELECT 2 UNION SELECT 3 UNION ALL SELECT 4 UNION ALL SELECT 5) B

-- 查看临时表数据

SELECT DEAL_TIME FROM TMP_DEAL_TIME ORDER BY DEAL_TIME

-- 理解1: 只要相邻时间为指定分钟数以内则聚合

SELECT DEAL_TIME, 

       CASE WHEN @lastDealTime IS NULL THEN @minLevel:=1

            WHEN DEAL_TIME > DATE_ADD(@lastDealTime, INTERVAL 30 MINUTE) 

              THEN @minLevel:=@minLevel+1 END AS COMPUT_CONDITION,

              

       @lastDealTime:=DEAL_TIME AS LAST_DEAL_TIME,

       @minLevel AS GROUP_LEVEL

  FROM (SELECT DEAL_TIME FROM TMP_DEAL_TIME ORDER BY DEAL_TIME) E,

       (SELECT @lastDealTime:=NULL) F,

       (SELECT @minLevel:=0) G

-- 理解2: 只和开始聚合的第一条时间比较, 只有当该条数据处在聚合第一条指定分钟数以内才归组

SELECT DEAL_TIME, 

       CASE WHEN @lastDealTime IS NULL THEN @minLevel:=1

            WHEN DEAL_TIME > DATE_ADD(@lastDealTime, INTERVAL 30 MINUTE) 

              THEN @minLevel:=@minLevel+1 END AS COMPUT_CONDITION,

              

       CASE WHEN @lastDealTime IS NULL THEN @lastDealTime:=DEAL_TIME

            WHEN DEAL_TIME > DATE_ADD(@lastDealTime, INTERVAL 30 MINUTE)

              THEN @lastDealTime:=DEAL_TIME END AS LAST_DEAL_TIME,

       @minLevel AS GROUP_LEVEL

  FROM (SELECT DEAL_TIME FROM TMP_DEAL_TIME ORDER BY DEAL_TIME) E,

       (SELECT @lastDealTime:=NULL) F,

       (SELECT @minLevel:=0) G

对于理解1的执行结果如下:

对于理解2的执行结果如下:

后续可以根据结果中的GROUP_LEVEL进行分组显示

上一篇聚合函数末尾处使用了GROUP BY,但没有做具体的介绍,这一篇就主要介绍一下GROUP BY的使用方法。顺便介绍一下对分组查询的过滤关键词HAVING的用法。

在MySQL中,GROUP BY关键词可以根据一个或多个字段对查询结果进行分组,类似于Excel中的数据透视表。可以单独使用,但一般情况下都是结合聚合函数来使用的。

语法格式如下:

下面演示都是基于这一张简单的省份对应大区的表格。

【单独使用GROUP BY】

单独使用GROUP BY关键字时,查询结果会只显示每个分组的第一条记录。

根据省份表里面的大区进行聚合,查询全国共分成了几个大区,SQL语句如下↓

【GROUP BY结合聚合函数】

5个聚合函数上一篇已经详细介绍了用法,GROUP BY和聚合函数结合使用也是最频繁的,下面就继续使用省份表来求每个大区有多少个省份,对应的聚合函数就是COUNT函数,SQL语句如下↓

【GROUP BY结合GROUP_CONCAT】

这还是一个很有用的功能,GROUP_CONCAT() 函数会把每个分组的字段值都合并成一行显示出来。

下面继续使用省份表,把每个大区对应的省份放在一行展示,用分号分开,SQL语句如下↓

【GROUP BY结合WITH ROLLUP】

WITH POLLUP关键词用来在所有记录的最后加上一条记录,这条记录是上面所有记录的总和,SQL语句如下↓

【GROUP BY结合HAVING】

在MySQL中,可以使用HAVING关键字对分组后的数据进行过滤。

使用 HAVING 关键字的语法格式如下:

HAVING关键词和WHERE关键词都可以用来过滤数据,且HAVING支持WHERE关键词中所有的 *** 作符和语法。但是WHERE和HAVING关键字也存在以下几点差异:

下面筛选一下省份数量在7个及以上的大区,SQL语句如下↓

【GROUP BY结合ORDER BY】

聚合后的数据,一半情况下也是需要进行排序的,通过ORDER BY对聚合查询结果进行排序,对省份数量按从大到小进行排序,SQL语句如下↓

End

◆ PowerBI开场白

◆ Python高德地图可视化

◆ Python不规则条形图


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zaji/8630264.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-19
下一篇2023-04-19

发表评论

登录后才能评论

评论列表(0条)

    保存