
如果你不关心列名,你可以使用
groupBy后跟
sum:
df.groupBy($"key").sum("value")否则最好替换
sum为
agg:
df.groupBy($"key").agg(sum($"value").alias("value"))最后,您可以使用原始SQL:
df.registerTempTable("df")sqlContext.sql("SELECt key, SUM(value) AS value FROM df GROUP BY key")欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)