apache spark是什么意思?

apache spark是什么意思?,第1张

n.火花火星电火花(指品质或感情)一星,丝毫,一丁点。

averysmallburningpieceofmaterialthatisproducedbysththatisburningorbyhittingtwohardsubstancestogether。

Asparkisatinybrightpieceofburningmaterialthatfliesupfromsomethingthatisburning.

Asparkofaqualityorfeeling,especiallyadesirableone,isasmallbutnoticeableamountofit.一站式出国留学攻略 http://www.offercoming.com

发现在2019-01-16 15:53:11,748:

最终executor和driver的心跳失效:

此外还有大量shuffle异常日志:

shuffle异常是否也是失败的根因?

1.由于无法获取到driver日志,没法做更多的分析。先排除推测机制的干扰。让客户关闭掉spark推测机制:spark.speculation

2.关闭掉推测机制后,任务运行也失败了。启动executor失败的次数达到上限

并且失败都有大量的socket异常打印,executor和driver网络通信中断:

还是怀疑是网络的问题

1.分析AM日志,发现AM日志从15点到之后都没有任何打印:

发现TID 13203 执行了40多min,在stage 31。虽然stage31的某个task执行慢,但是最终是执行成功的。spark的shuffle对网络性能要求比较高,准备进行如下shuffle调优,避免单个task问题:

准备进行如下调整:调优化shuffle参数:

spark.shuffle.file.buffer=64k,

spark.reducer.maxSizeInFlight=96M

spark.network.timeout=300s

spark.rpc.askTimeout=300s

spark.shuffle.io.serverThreads=8

1.部分task执行慢,是由于shuffle性能影响,调整shuffle参数规避。

spark.shuffle.file.buffer=64k,

spark.reducer.maxSizeInFlight=96M

spark.network.timeout=300s

spark.rpc.askTimeout=300s

spark.shuffle.io.serverThreads=8

2.不排除网络问题的影响,试图调整os参数,但是客户生产

net.ipv4.tcp_keepalive_time= 15

net.ipv4.tcp_keepalive_probes = 10

net.ipv4.tcp_keepalive_intvl= 30

3.关闭sasl

spark.authenticate.enableSaslEncryption=false

spark.authenticate=false

这个错误通常是由于Java或Spark配置问题引起的。下面是几种可能的解决方法:

检查Java是否正确安装并配置在系统环境变量中,确认环境变量JAVA_HOME的值是否正确,可以尝试在终端窗口中运行java命令来确认Java是否可以正常运行。

确认Spark的版本与Java版本是否兼容,可以通过在Spark官方网站查看Spark版本和Java版本之间的兼容性矩阵。

检查防火墙或网络代理是否阻止Spark与Java通信。尝试关闭防火墙或暂时禁用网络代理,然后再次运行代码。

尝试在SparkConf中设置spark.driver.host属性,如下所示:

pythonCopy codeconf = SparkConf().setMaster("local[*]").setAppName("test_spark_app") \

.set("spark.driver.host", "127.0.0.1")

这将指示Spark驱动程序使用指定的IP地址作为其主机名,可以尝试设置为本地IP地址。

尝试删除.pycache目录。如果您使用Python 3,可能会在代码文件所在的目录中找到.pycache目录,其中可能会包含与Spark上下文相关的缓存文件。尝试删除.pycache目录并重新运行代码。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/12009679.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-20
下一篇2023-05-20

发表评论

登录后才能评论

评论列表(0条)

    保存