
应该vlookup典型使用, 用检索现列表信息, 通客户名称检索该客户其信息假A-C列原始信息, E列进行查询F列显示相应信息E1输入三元 F1输入函数: =vlookup(E1,A:C,2) 应三元B列信息
在获得数据之后、分析数据之前,我们一般需要对数据总体进行一个概览,如有哪些字段,每个字段的类型,值是否缺失等,以下列出了几种方法,供我们方便快捷的查看dataframe的数据类型。
1、维度查看:dfshape
返回结果如下如所示,说明此表格一共有20w+行,16列:
2、数据表基本信息(维度、列名称、数据格式、所占空间等):dfinfo()
返回结果如图,可见,用info方法可以非常全面的看出表格的各项属性,包括:
1表格的维度:203401行 16列,RangeIndex:0-203400
2表格的列名,是否为空值和列字段类型dtype(后面我会给出pandas的数据类型和Python数据类型的匹配关系图!!!)
3表格所占空间:248M+
3、每一列数据的格式:dfdtypes
这个功能与dfinfo()类似,如果只想查看每一列存储的是什么数据格式,那么可以直接使用dfdtypes
返回结果如图,可以看到,这个结果基本就是dfinfo()的简化版,指明了各列的数据类型。
4、某一列格式:df['B']dtype
分析过程中,由于字段繁多,所以用到某字段时需要适时查看,同样可以运用dtype,此处不再赘述。
由上文可见,float64,int64,object都是pandas专有的数据格式,同理,Python,numpy都有自己的一套数据格式,它们之间的对应关系可参考下面的表格:
这里需要强调的是object类型实际上可以包括多种不同的类型,比如一列数据里,既有整型、浮点型,也有字符串类型,这些在pandas中都会被标识为‘object’,所以在处理数据时,可能需要额外的一些方法提前将这些字段做清洗,strreplace(),float(),int(),astype(),apply()等等。
如果觉得有用,给我点个赞吧,你的支持就是对我最大的鼓励!ღ( ´・ᴗ・` )❥
在数据处理中,经常遇到以下情景:
需要在原表的基础上增加一列,规则为 NAME 列的首位加上 DATE 列的年份,结果如下:
pandas支持不同列直接相加,但是直接切片不会得到想要的结果。
pandas提供了 map 方法,可以完美解决这个问题:
这样就会取出 NAME 列的首位字,按照这个方法,可以这样得到我们想要的 RESULT 列:
以上就是关于pandas常用函数汇总全部的内容,包括:pandas常用函数汇总、Pandas数据类型 *** 作、pandas 怎么根据一列的数据的值的情况判断来生成另外一列的数值等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)