Spark Dataframe reducebykey之类的 *** 作

Spark Dataframe reducebykey之类的 *** 作,第1张

Spark Dataframe reducebykey之类的 *** 作

如果你不关心列名,你可以使用

groupBy
后跟
sum

df.groupBy($"key").sum("value")

否则最好替换

sum
agg

df.groupBy($"key").agg(sum($"value").alias("value"))

最后,您可以使用原始SQL:

df.registerTempTable("df")sqlContext.sql("SELECt key, SUM(value) AS value FROM df GROUP BY key")


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zaji/5640542.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-12-16
下一篇2022-12-16

发表评论

登录后才能评论

评论列表(0条)

    保存