PANDAS 在 sum 时通过level计算时index重复提示错误的设置

PANDAS 在 sum 时通过level计算时index重复提示错误的设置,第1张

user=pd.read_csv(‘dx_user_1024.txt’,sep=‘|’,header=0)
print(user.head())
usergroup=user[[‘规整后的主叫号码’,‘规整后的被叫号码’,‘地市’]].groupby([‘规整后的主叫号码’,‘地市’]).count().reset_index()

print(usergroup)
usergroup.set_index([‘地市’,‘规整后的主叫号码’],drop=True,inplace=True)
usergroup.sort_values(‘地市’,inplace=True)
print(usergroup)
usergroup[‘分组占比’] = usergroup[‘规整后的被叫号码’].sum(level=‘地市’)/usergroup[‘规整后的被叫号码’]
print(usergroup)

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/langs/916664.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-05-16
下一篇2022-05-16

发表评论

登录后才能评论

评论列表(0条)

    保存