python去重函数是什么

python去重函数是什么,第1张

概述python去重函数是什么

数据去重可以使用duplicated()和drop_duplicates()两个方法。

DataFrame.duplicated(subset = None,keep =‘first’)返回boolean SerIEs表示重复行

参数:

subset:列标签或标签序列,可选

仅考虑用于标识重复项的某些列,默认情况下使用所有列

keep:{‘first’,‘last’,False},默认’first’

first:标记重复,True除了第一次出现。

last:标记重复,True除了最后一次出现。

错误:将所有重复项标记为True。

相关推荐:《Python基础教程》

import numpy as npimport pandas as pdfrom pandas import SerIEs, DataFramedf = pd.read_csv('./demo_duplicate.csv')print(df)print(df['Seqno'].unique()) # [0. 1.]# 使用duplicated 查看重复值# 参数 keep 可以标记重复值 {'first','last',False}print(df['Seqno'].duplicated())'''0    False1     True2     True3     True4    Falsename: Seqno, dtype: bool'''# 删除 serIEs 重复数据print(df['Seqno'].drop_duplicates())'''0    0.04    1.0name: Seqno, dtype: float64'''# 删除 dataframe 重复数据print(df.drop_duplicates(['Seqno'])) # 按照 Seqno 来去重'''   Price     Seqno   Symbol   time0  1623.0    0.0   APPL  14734119624  1649.0    1.0   APPL  1473411963'''# drop_dujplicates() 第二个参数 keep 包含的值 有: first、last、Falseprint(df.drop_duplicates(['Seqno'], keep='last')) # 保存最后一个'''   Price     Seqno   Symbol   time3  1623.0    0.0   APPL  14734119634  1649.0    1.0   APPL  1473411963'''
总结

以上是内存溢出为你收集整理的python去重函数是什么全部内容,希望文章能够帮你解决python去重函数是什么所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/langs/1184316.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-06-03
下一篇2022-06-03

发表评论

登录后才能评论

评论列表(0条)

    保存