
图示点击从表格
选中要 *** 作的列
再次选择数值列,再转换菜单中选择逆透视列
得到
删除属性列,点击关闭并加载
1、在单元格中输入原始数据,求出最大值、最小值、经验组距和经验组数。如下图显示。本文主要以超市每天销售额为例。
2、根据不同需求和数据显示情况,绘制频数分布表。如下图,(可根据个人想要设置组距)
3、计算各组频数,选定B16:B23,单击“工具”中的“插入函数”,选“统计”函数FREQUENCY。
4、选定区域,确定FREQUENCY函数的两个参数的值,如图。
5、按Shift+Ctrl+Enter组合键,并计算出频率密度、频率、向上和向下累积的频率和频率密度,如下图各值。
6、选择表格数据,进行直方图的绘制,具体表现为下图。
lag表示 分组排序后 ,组内后面一条记录减前面一条记录的差,第一条可返回 NULL ;lag(arg1,arg2,arg3):
arg1是从其他行返回的表达式
arg2是希望检索的当前行分区的偏移量。是一个正的偏移量,时一个往回检索以前的行的数目。
arg3是在arg2表示的数目超出了分组的范围时返回的值。
sql over的作用及用法
RANK ( ) OVER ( [query_partition_clause] order_by_clause )
DENSE_RANK ( ) OVER ( [query_partition_clause] order_by_clause )
可实现按指定的字段分组排序,对于相同分组字段的结果集进行排序,
其中PARTITION BY 为分组字段,ORDER BY 指定排序字段
over不能单独使用,要和分析函数:rank(),dense_rank(),row_number()等一起使用。
其参数:over(partition by columnname1 order by columnname2)
含义:按columname1指定的字段进行分组排序,或者说按字段columnname1的值进行分组排序。
例如:employees表中,有两个部门的记录:department_id =10和20
select department_id,rank() over(partition by department_id order by salary) from employees就是指在部门10中进行薪水的排名,在部门20中进行薪水排名。如果是partition by org_id,则是在整个公司内进行排名。
groupby 方法是pandas中的分组方法,对数据框采用 groupby 方法后,返回的是 DataFrameGroupBy 对象,一般分组 *** 作后会进行聚合 *** 作。
对数据框按 A 列进行分组,产生分组数据框。分组数据框是可迭代对象,可以进行循环遍历,可以看出在循环中,每个元素的类型是元组,
元组的第一个元素是分组值,第二个元素是对应的分组数据框。
可以对分组后的数据框直接使用聚合方法 agg ,对分组数据框的每一列计算统计函数值。
可以根据数据框外的序列数据对数据框进行分组,需要注意 序列长度需要与数据框行数相同 。
可以根据数据框的多列对数据框进行分组。
根据 A , B 列进行分组,然后求和。
可以根据索引对数据框进行分组,需要设置 level 参数。
数据框只有一层索引,设置参数 level=0 。
当数据框索引有多层时,也可以根据需求设置 level 参数,完成分组聚合。
设置 level 参数,如需要根据第一层索引,即 id1 进行分组,可以设置 level=0 或 level='id1' 完成分组聚合。
分组后一般会进行聚合 *** 作,用 agg 方法进行聚合。
对分组后数据框使用单个函数进行聚合,单个聚合函数会对每列进行计算,然后合并返回。聚合函数以字符串的形式传入。
可以对分组后的数据指定列进行分组聚合。需要注意 子列需要用[]包裹 。
聚合函数也可以传入自定义的匿名函数。
聚合函数可以是多个函数。聚合时,多个聚合函数会对每列进行计算,然后合并返回。聚合函数以列表的形式传入。
聚合返回后的数据列名有两层索引,第一层是聚合的列名,第二层是使用的聚合函数名。如果需要对返回的聚合函数名重命名,
需要在传参时,传入元组,第一个元素为聚合函数名,第二个元素为聚合函数。
同样,也可以传入匿名函数。
如果需要对不同的列进行不同的聚合计算,则需要传入字典的形式。
可以重命名聚合后的列名,注意 只能对一列传入一个聚合函数时有效 。
SELECT SUBSTR(地区,1,3) AS 地区,
SUM(面积)AS 面积
COUNT(SUBSTR(地区,1,3))AS 个数
FROM 地区面积表
GROUP BY SUBSTR(地区,1,3)
1、算术平均、求和SUM 、几何平均GEOMEAN 、调和平均HARMEAN、计算众数
2、MODE 、中位数、MEDIAN 、VAR 、标准差、STDEV 、计算数据的偏度SKEW
3、计算数据的峰度、KURT 、频数统计、COUNTIF、组距式分组的频数统计FREQUENCY
4、随机实数RANDO、区间的随机整数RANDBETWEEN 、二项分布的概率值 BINOMDIST、泊松分布的概率值POISSON、正态分布的概率值NORMDIST、计算正态分布的P值NORMSDIST
5、在菜单:插入——函数——选择类别——统计,里面有很多统计方面的函数,每个统计类的函数的用法和简要说明都在下面。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)