PyCharm中基础加载excel文件以及对文件内数据进行增删查改

PyCharm中基础加载excel文件以及对文件内数据进行增删查改,第1张

PyCharm中基础加载excel文件以及对文件内数据进行增删查改
# 1.    加载数据集
data=pd.read_excel(r'ftx.xls')
print(data)
# 2.   统计 列名 为 月 的频数
print(data['月'].value_counts())
# 3. 统计不同的年下有多少个样本(频数)
print(data['年'].value_counts())
# 4.   求销售数量列的最大值和最小值
print(data['销售数量'].max())
print(data['销售数量'].min())
# 5.   按照年列数据升序,销售数量列数据降序排序
print(data.sort_values(['年','销售数量'],ascending=([True,False])))
# 6.   提取时间为2009年且销售区域为上海和沈阳的数据df1
df1=data[(data['年']==2009)&(data['销售区域'].isin(['上海','沈阳']))]
print(df1)
# 7.   对df1的数据按照销售区域进行分组,并计算各分组销售数量的均值
g1=df1.groupby('销售区域')
print(g1.agg(np.mean)['销售数量'])
# 8.   对df1的数据按照月进行分组。并计算每月销售数量的总和
g2=df1.groupby('月')
print(g2.agg(np.sum)['销售数量'])
# 9.   对数据帧df添加 季度 一列,根据 月 列进行划分
def ftx(x):
    if x==12 or x==1 or x==2:
        return '第一季度'
    elif 3<=x<6:
        return '第二季度'
    elif 6<=x<9:
        return '第三季度'
    elif 9<=x<12:
        return '第四季度'
data['季度']=data['月'].map(ftx)
print(data)
# 10.  提取时间为2009年且销售区域为上海的数据df2
df2=data[(data['年']==2009)&(data['销售区域'].isin(['上海']))]
# 11.  对df2的数据按照季度进行分组,计算每季度的销售总和
g3=df2.groupby('季度')
print(g3.agg(np.sum)['销售数量'])

#对需要数据进行分组 

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zaji/5650915.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-12-16
下一篇2022-12-16

发表评论

登录后才能评论

评论列表(0条)

    保存