Python Pandas 向DataFrame中添加一行一列

Python Pandas 向DataFrame中添加一行一列,第1张

在Pandas的DataFrame中添加一行或者一列,添加行有 df.loc[] 以及 df.append() 这两种方法,添加列有 df[] 和 df.insert() 两种方法, 下面对这几种方法的使用进行简单介绍。

采用 loc[] 方法多适用于对空的dataframe循环遍历添加行,这样索引可以从0开始直到数据结果,不会存在索引冲突的问题。

不过在使用insert的过程中发现 454: DeprecationWarning: `input_splitter` is deprecated since IPython 7.0, prefer `input_transformer_manager`. status, indent_spaces = self.shell.input_splitter.check_complete(code) 这个提示,猜测是有别的地方出问题了,还需要调试。

主要参考资料:

遇到如下“没有”索引的文件,处理及其不方便。

可以看到

pandas将第一行处理为了列索引,同时由于表格中的第一格(左上角)不为空,因此从左侧开始的第一列并不为行索引,重新为数据添加了新的行索引,从第二行开始,0为初始第一行。

这里有两个语法是df.reindex()和df.rename()

修改索引完成,但成功出现错误。

添加数据loc是比较方便的做法,但如果第n行有数据,那么new_data将会替换这个数据

new_data=['a','b','c','d']

df.loc[n] = new_data

另一种做法是用append,直接在数据末尾增加一行

data={'a':9,'b':10,'c':11,'d':12}

df.append(data,ignore_index=True)

看看处理结果

data.sort_values(by='列名')

DataFrame新增一列:如果list为空,赋值为0;如果list列不为空,将amount列中对应的行值赋值到新列。

pandas是基于NumPy的一种工具,该工具是为解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型,提供了高效地 *** 作大型数据集所需的工具。

pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。

Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。

Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。 Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/bake/11427187.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-16
下一篇2023-05-16

发表评论

登录后才能评论

评论列表(0条)

    保存