Jenkins 以Docker方式启动的agents

Jenkins 以Docker方式启动的agents,第1张

1打开会话属性对话框。
2在[类别]中选择[连接: SSH]。
图1:xagent设置
3选择[用密码处理的 Xagent (SSH代理)]。
4点击[确定]。
如何通过Xagent登陆SSH服务器:
1在Xshell进行设置以启用Xagent。
2如未运行Xagent则运行Xagent。
3登陆SSH服务器。
此时,SSH服务器需支持公钥用户身份验证,且在服务器上注册有要使用的用户秘钥的公钥。不知如何使用的可以参考:xshell公钥用户身份验证使用方法讲解
4出现用户秘钥密码对话框。输入所选用户秘钥的密码。
注释
连接: 在SSH设置项下选择[自动启动Xagent]时可省略第2项的过程。用户秘钥密码对话框在所选密钥在Close状态时出现。用户秘钥的状态可在Xagent的用户秘钥目录进行确认。

Server:zabbix sever的列表,逗号间隔,agent对server端的主机限定。
ServerActive:健康检查,带端口的,agent主动往zabbix server发数据。
ListenPort:agent在被监控机器运行的程序端口。
Hostname:zabbix server配置的主机名称。

刚开始耍zabbix agent,建议不见使用docker,实际上,容易变动的,我都不建议使用docker,整理镜像是一件非常麻烦的事情。因为镜像都是非常精简的,万一你需要的功能没有,你是解决掉所有的依赖,来添加到镜像,还是在服务器中执行yum install来得方便?还有一点就是,使用docker,会让你很难入门,因为容器启动失败,都不知道报错对应位置的配置,或者不了解具体的报错指代。

环境:

K8s集群:211-214

被监控机器:jenkins服务器:123

Agent的安装,参考了这篇博客:

>我安装了一个zabbix监控,一直很顺利,后来不知道问什么服务起不来了,服务器总是提醒我10051端口没有打开,于是我仔细理了一遍又一遍,服务总是启动不起来:
Starting zabbix_server: /etc/initd/functions: line 536: /etc/initd//sbin/zabbix_server: No such file or directory
于是我打开/etc/initd/zabbix_server配置文件中
发现
BASEDIR=/usr/local/zabbix/zabbix
路径不对
原来是我执行
sed -i 's/BASEDIR=\/usr\/local/BASEDIR=\/usr\/local\/zabbix/g'/etc/initd/zabbix_server
sed -i 's/BASEDIR=\/usr\/local/BASEDIR=\/usr\/local\/zabbix/g'/etc/initd/zabbix_agentd
的时候执行了两遍,感觉特别的手欠,后来服务死活启动不起来,然后把启动文件zabbix_server和zabbix_agentd中的BASEDIR=/usr/local/zabbix/zabbix改成BASEDIR=/usr/local/zabbix/就OK了。
vi zabbix_server
# Edit these to match your system settings
# Zabbix-Directory
BASEDIR=/usr/local/zabbix/
service zabbix_server start
Starting zabbix_server: [ OK ]
service zabbix_agentd start
Starting zabbix_agentd: [ OK ]

问题:

部分主机宕机后,CDH集群启动成功,但是有某些主机提示“无法找到主机的NTP 服务,或该服务未响应时钟偏差请求”

解决步骤:

1先同步服务器时钟

执行命令:

service ntpd stop  停止ntp服务

ntpdate  主机ip   同步主机时钟

service ntpd start  启动ntp服务

service ntpd status  查看服务启动情况

ntpq -pn  查看同步的服务器IP

ntpstat  查看同步结果

2在CDH界面停止主机上的角色

3进入该主机的CDH安装目录执行 /cloudera-scm-agent restart (即需要在问题主机上重启cloudera-scm-agent服务)

目录在 etc/initd下

4等待CDH界面刷新,问题解决,大概等3  5分钟就看不到时钟偏差问题了。

解决思路:

1同步服务器时钟是为了确定是否是ntp服务本身的问题。

2发现服务器时钟没有问题,所以不是ntp服务本身的问题。
其中这句话说,如果该命令失败、NTP 未与服务器同步,或主机的 NTP 后台程序未运行或无法联系,该测试将返回运行状况“不良”。

所以可能是CDH集群本身没有接收到时间同步服务器的结果,于是执行重启agent的命令。至此问题解决!


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zz/10350381.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-07
下一篇2023-05-07

发表评论

登录后才能评论

评论列表(0条)

    保存