
# 1. 加载数据集
data=pd.read_excel(r'ftx.xls')
print(data)
# 2. 统计 列名 为 月 的频数
print(data['月'].value_counts())
# 3. 统计不同的年下有多少个样本(频数)
print(data['年'].value_counts())
# 4. 求销售数量列的最大值和最小值
print(data['销售数量'].max())
print(data['销售数量'].min())
# 5. 按照年列数据升序,销售数量列数据降序排序
print(data.sort_values(['年','销售数量'],ascending=([True,False])))
# 6. 提取时间为2009年且销售区域为上海和沈阳的数据df1
df1=data[(data['年']==2009)&(data['销售区域'].isin(['上海','沈阳']))]
print(df1)
# 7. 对df1的数据按照销售区域进行分组,并计算各分组销售数量的均值
g1=df1.groupby('销售区域')
print(g1.agg(np.mean)['销售数量'])
# 8. 对df1的数据按照月进行分组。并计算每月销售数量的总和
g2=df1.groupby('月')
print(g2.agg(np.sum)['销售数量'])
# 9. 对数据帧df添加 季度 一列,根据 月 列进行划分
def ftx(x):
if x==12 or x==1 or x==2:
return '第一季度'
elif 3<=x<6:
return '第二季度'
elif 6<=x<9:
return '第三季度'
elif 9<=x<12:
return '第四季度'
data['季度']=data['月'].map(ftx)
print(data)
# 10. 提取时间为2009年且销售区域为上海的数据df2
df2=data[(data['年']==2009)&(data['销售区域'].isin(['上海']))]
# 11. 对df2的数据按照季度进行分组,计算每季度的销售总和
g3=df2.groupby('季度')
print(g3.agg(np.sum)['销售数量'])
#对需要数据进行分组
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)