
方法
Dataframe.merge(another_DF)在列的默认交集合并(使用来自两个话语结构相同名称的所有列),并使用
how='inner'-因此,我们期望有行相同#后
innerjoin(如果没有的话语结构有重复):
len(A.merge(B)) == len(A)
PS,如果其中一个DF有重复的行,它将无法正常工作-有关此类情况,请参见下文
演示:
In [128]: AOut[128]: A B C0 1 2 31 4 5 6In [129]: BOut[129]: A B C0 4 5 61 1 2 32 9 8 7In [130]: len(A.merge(B)) == len(A)Out[130]: True
对于包含重复项的数据集,我们可以删除重复项并使用相同的方法:
In [136]: AOut[136]: A B C0 1 2 31 4 5 62 1 2 3In [137]: BOut[137]: A B C0 4 5 61 1 2 32 9 8 73 4 5 6In [138]: A.merge(B).drop_duplicates()Out[138]: A B C0 1 2 32 4 5 6In [139]: len(A.merge(B).drop_duplicates()) == len(A.drop_duplicates())Out[139]: True
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)