
1、分组使用聚合函数做数据统计。
2、遍历groupby的结果理解执行流程。pandas分组是一个常用的功能,如分别统计每个月的股票波动率、每个部门的人数、每个季度的利润等等。
课程学习: Pandas 数据处理基础入门
除了直接填充值,我们还可以通过参数,将缺失值前面或者后面的值填充给相应的缺失值。例如使用缺失值前面的值进行填充:
或者是后面的值:
可以看到,连续缺失值也是按照前序数值进行填充的,并且完全填充。这里,我们可以通过 limit= 参数设置连续填充的限制数量:
除了上面的填充方式,还可以通过 Pandas 自带的求平均值方法等来填充特定列或行。举个例子:
插值是数值分析中一种方法。简而言之,就是借助于一个函数(线性或非线性),再根据已知数据去求解未知数据的值。插值在数据领域非常常见,它的好处在于,可以尽量去还原数据本身的样子。我们可以通过 interpolate() 方法完成线性插值。
对于 interpolate() 支持的插值算法,也就是 method= 。下面给出几条选择的建议:
除了上面提到的一些方法和技巧,实际上 Pandas 常用的还有:
--- End ---
使用pandas包把数据结构写入Excel的时候,因为这个方法缺少了一个类似pd.to_csv()中的mode参数,以至于你每次用诸如pd.to_excel的形式取写入一个Excel的时候,系统都会帮你重新创建一个文件。也就是意味着前面的文件会被覆盖掉,你得到的只能是最后一个df写入的结果文件。
我们可以通过创建一个ExcelWriter对象,来完美解决上面的问题。
这个写入对象,会帮我们将DF写入到工作簿中
如果想把多个dataframe数据写在同一个工作簿的同一个表里面:利用strartcol和startrow
如果已经存在一个Excel文件,怎么填入数据。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)