Python 连接hive(Linux)

Python 连接hive(Linux),第1张

之所以选择基于Linux系统用Python连接hive,是因为在window下会出现Hadoop认证失败的问题。会出现执行python脚本的机器无目标hive的kerberos认证信息类似错误,也会出现sasl调用问题:

该错误我尝试多次,未能解决(有知道window下解决方案的欢迎留言),所以建议使用Linux系统。

VMware Workstation +Ubuntu

网上教程很多,本文推荐一个教程: https://blog.csdn.net/stpeace/article/details/78598333

主要是以下四个包:

在安装包sasl的过程会出现麻烦,主要是Ubuntu中缺乏sasl.h的问题,这里可以通过下面语句解决

这和centos有一些区别。

本文是基于本机虚拟机用Python连接的公司测试环境的hive(生产环境和测试环境是有隔离的,生产环境需要堡垒机才能连接)

因缺乏工程和计算机基础的知识,对很多的地方都了解的不够深入,欢迎大神指点,最后向以下两位大佬的帖子致谢:

[1] https://www.zhihu.com/question/269333988/answer/581126392

[2] https://mp.weixin.qq.com/s/cdFxkphMtJASQ7-nKt13mg

sudo apt-get install mysql-server mysql-client

1). 建立数据库hive,

create database hive

2). 创建用户hive

create user ‘hive’@’%’ identified by ‘hive’

3).创建hive用户,并授权

grant all on hive.* to hive@’%’ identified by ‘hive’

flush privileges

在启动mysql时可能遇到的问题:

如果你想把查询的结果保存到linux系统上的某个文件中,可以执行这个HQL。insertoverwritelocaldirectory'/tmp/output'select*fromtablea这时查询的结果会被保存在HiveServer所在节点的的/tmp/output目录下。如果你使用的Hive版本是0.11及以上,还可以指定列之间的分隔符,具体可以看这个问题单HIVE-3682


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/8987108.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-23
下一篇2023-04-23

发表评论

登录后才能评论

评论列表(0条)

    保存