检查pandas数据框是否为其他数据框的子集

检查pandas数据框是否为其他数据框的子集,第1张

检查pandas数据框是否为其他数据框的子集

方法

Dataframe.merge(another_DF)
在列的默认交集合并(使用来自两个话语结构相同名称的所有列),并使用
how='inner'
-因此,我们期望有行相同#后
innerjoin
(如果没有的话语结构有重复):

len(A.merge(B)) == len(A)

PS,如果其中一个DF有重复的行,它将无法正常工作-有关此类情况,请参见下文

演示:

In [128]: AOut[128]:   A  B  C0  1  2  31  4  5  6In [129]: BOut[129]:   A  B  C0  4  5  61  1  2  32  9  8  7In [130]: len(A.merge(B)) == len(A)Out[130]: True

对于包含重复项的数据集,我们可以删除重复项并使用相同的方法:

In [136]: AOut[136]:   A  B  C0  1  2  31  4  5  62  1  2  3In [137]: BOut[137]:   A  B  C0  4  5  61  1  2  32  9  8  73  4  5  6In [138]: A.merge(B).drop_duplicates()Out[138]:   A  B  C0  1  2  32  4  5  6In [139]: len(A.merge(B).drop_duplicates()) == len(A.drop_duplicates())Out[139]: True


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zaji/5648519.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-12-16
下一篇2022-12-16

发表评论

登录后才能评论

评论列表(0条)

    保存