做数仓项目所遇到的一些问题

做数仓项目所遇到的一些问题,第1张

前言

在项目实际运行中,并不一定会像视频一样运行那么顺利,总会遇到一些大大小小的问题,而这些问题可能才是工作中最大可能遇到的,这里对部分问题进行一些总结。


一、flume采集数据不到hdfs上

flume to kafka配置文件,粗心把a1.sources.r1.filegroups.f1的filegroups漏掉了,第一个拦截器api的parse写成parsearray

二、hive用spark引擎的时候运行insert sql的时候报错连接不上spark客户端

代码如下(示例):


总结

提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/langs/917889.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-05-16
下一篇2022-05-16

发表评论

登录后才能评论

评论列表(0条)

    保存