急求Excel 函数 (关于分组、排列)

急求Excel 函数 (关于分组、排列),第1张

图示点击从表格

选中要 *** 作的列

再次选择数值列,再转换菜单中选择逆透视列

得到

删除属性列,点击关闭并加载

1、在单元格中输入原始数据,求出最大值、最小值、经验组距和经验组数。如下图显示。本文主要以超市每天销售额为例。

2、根据不同需求和数据显示情况,绘制频数分布表。如下图,(可根据个人想要设置组距)

3、计算各组频数,选定B16:B23,单击“工具”中的“插入函数”,选“统计”函数FREQUENCY。

4、选定区域,确定FREQUENCY函数的两个参数的值,如图。

5、按Shift+Ctrl+Enter组合键,并计算出频率密度、频率、向上和向下累积的频率和频率密度,如下图各值。

6、选择表格数据,进行直方图的绘制,具体表现为下图。

lag表示 分组排序后 ,组内后面一条记录减前面一条记录的差,第一条可返回 NULL ;lag(arg1,arg2,arg3):

arg1是从其他行返回的表达式

arg2是希望检索的当前行分区的偏移量。是一个正的偏移量,时一个往回检索以前的行的数目。

arg3是在arg2表示的数目超出了分组的范围时返回的值。

sql over的作用及用法

RANK ( ) OVER ( [query_partition_clause] order_by_clause )

DENSE_RANK ( ) OVER ( [query_partition_clause] order_by_clause )

可实现按指定的字段分组排序,对于相同分组字段的结果集进行排序,

其中PARTITION BY 为分组字段,ORDER BY 指定排序字段

over不能单独使用,要和分析函数:rank(),dense_rank(),row_number()等一起使用。

其参数:over(partition by columnname1 order by columnname2)

含义:按columname1指定的字段进行分组排序,或者说按字段columnname1的值进行分组排序。

例如:employees表中,有两个部门的记录:department_id =10和20

select department_id,rank() over(partition by department_id order by salary) from employees就是指在部门10中进行薪水的排名,在部门20中进行薪水排名。如果是partition by org_id,则是在整个公司内进行排名。

groupby 方法是pandas中的分组方法,对数据框采用 groupby 方法后,返回的是 DataFrameGroupBy 对象,一般分组 *** 作后会进行聚合 *** 作。

对数据框按 A 列进行分组,产生分组数据框。分组数据框是可迭代对象,可以进行循环遍历,可以看出在循环中,每个元素的类型是元组,

元组的第一个元素是分组值,第二个元素是对应的分组数据框。

可以对分组后的数据框直接使用聚合方法 agg ,对分组数据框的每一列计算统计函数值。

可以根据数据框外的序列数据对数据框进行分组,需要注意 序列长度需要与数据框行数相同

可以根据数据框的多列对数据框进行分组。

根据 A , B 列进行分组,然后求和。

可以根据索引对数据框进行分组,需要设置 level 参数。

数据框只有一层索引,设置参数 level=0 。

当数据框索引有多层时,也可以根据需求设置 level 参数,完成分组聚合。

设置 level 参数,如需要根据第一层索引,即 id1 进行分组,可以设置 level=0 或 level='id1' 完成分组聚合。

分组后一般会进行聚合 *** 作,用 agg 方法进行聚合。

对分组后数据框使用单个函数进行聚合,单个聚合函数会对每列进行计算,然后合并返回。聚合函数以字符串的形式传入。

可以对分组后的数据指定列进行分组聚合。需要注意 子列需要用[]包裹

聚合函数也可以传入自定义的匿名函数。

聚合函数可以是多个函数。聚合时,多个聚合函数会对每列进行计算,然后合并返回。聚合函数以列表的形式传入。

聚合返回后的数据列名有两层索引,第一层是聚合的列名,第二层是使用的聚合函数名。如果需要对返回的聚合函数名重命名,

需要在传参时,传入元组,第一个元素为聚合函数名,第二个元素为聚合函数。

同样,也可以传入匿名函数。

如果需要对不同的列进行不同的聚合计算,则需要传入字典的形式。

可以重命名聚合后的列名,注意 只能对一列传入一个聚合函数时有效

SELECT SUBSTR(地区,1,3) AS 地区,

SUM(面积)AS 面积

COUNT(SUBSTR(地区,1,3))AS 个数

FROM 地区面积表

GROUP BY SUBSTR(地区,1,3)

1、算术平均、求和SUM 、几何平均GEOMEAN 、调和平均HARMEAN、计算众数

2、MODE 、中位数、MEDIAN 、VAR 、标准差、STDEV 、计算数据的偏度SKEW

3、计算数据的峰度、KURT 、频数统计、COUNTIF、组距式分组的频数统计FREQUENCY

4、随机实数RANDO、区间的随机整数RANDBETWEEN 、二项分布的概率值 BINOMDIST、泊松分布的概率值POISSON、正态分布的概率值NORMDIST、计算正态分布的P值NORMSDIST

5、在菜单:插入——函数——选择类别——统计,里面有很多统计方面的函数,每个统计类的函数的用法和简要说明都在下面。

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/langs/12462489.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-23
下一篇2023-05-23

发表评论

登录后才能评论

评论列表(0条)

    保存