
您需要
nunique:
df = df.groupby('domain')['ID'].nunique()print (df)domain'facebook.com' 1'google.com' 1'twitter.com' 2'vk.com' 3Name: ID, dtype: int64如果需要字符:
strip
'
df = df.ID.groupby([df.domain.str.strip("'")]).nunique()print (df)domainfacebook.com 1google.com 1twitter.com 2vk.com 3Name: ID, dtype: int64或正如乔恩所说:
df.groupby(df.domain.str.strip("'"))['ID'].nunique()您可以像这样保留列名:
df = df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.nunique})print(df) domain ID0 fb 11 ggl 12 twitter 23 vk 3区别在于
nunique()返回一个Series并
agg()返回一个Dataframe。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)