python数据分析和数据挖掘之pandas模块(二)

python数据分析和数据挖掘之pandas模块(二),第1张

python数据分析和数据挖掘之pandas模块(二) 一、pandas模块

pandas(Python Data Analysis Library)是基于numpy的数据分析模块,提供了大量标准数据模型和高效 *** 作大型数据集所需要的工具,可以说pandas是使得Python能够成为高效且强大的数据分析环境的重要因素之一。它最主要的两个数据结构是series和Dataframe。本文承接上文接着介绍Dataframe的 *** 作。

二、数据框的语法及其功能描述 语句功能描述pandas。FDataframe(data,columns=[],index=[])创建数据框pd.read_csv()将CSV文件的数据导入到内存中,快速构建数据库pd.concat()按横向或纵向合并两个pandas数据结构pd.get_dummies()将类别变量转变为独热编码Dataframe.mean()按行或按列计算平均值Dataframe.dropna()删除所有缺失数据的行或列Dataframe.drop_duplicates删除所有重复的行Dataframe.head()默认返回数据框中前五行Dataframe.tail()默认返回数据框中最后五行

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zaji/4827976.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-11-10
下一篇2022-11-10

发表评论

登录后才能评论

评论列表(0条)

    保存