查询zabbix数据库alerts怎么看告警的恢复时间_工具

zabbix的告警通知非常灵活，支持的通知类型有Email、Jabber、sms、script 。其在设备需要修护时，同样可以提供同nagios 一样的设备维护期间，暂停告警的功能有，而且其相对于nagios 更加灵活。本篇就针对zabbix的告警和设备维护功能进行下说明。

一、media types 告警通知

本篇以脚本通知为例进行说明

1、配置AlertScriptsPath

# vim /etc/zabbix/zabbix_serverconf

找到# AlertScriptsPath=${datadir}/zabbix/alertscripts 行，增加如下内容

AlertScriptsPath=/etc/zabbix/alertscripts

配置完成后，需要重启zabbix_server服务生效，在后面media type 写入的脚本名称就会从上面的配置目录中查找并执行。

2、创建media type

步骤为：登录 zabbix web 页面------Administration--------Media types--------Create Media Type(右上角) ，如下图：

配置完成后，save保存即可。

3、创建Action

步骤为：登录 zabbix web 页面---- Configuration ---- Actions ---- Create action , 如下图

subject为发送主题，message为发送内容（通过message内容的自定义，可以例如在告警时，将其他相关信息也进行通知，可以从侧面了解整个主机的运行情况－－－某次面试时面试官曾提过的需求），这两者的内容都可以很方便的进行更改。勾选了Recovery message 选项，会在监控项恢复时也会给一个恢复的提示。

condeitions 选项中设置的是触发通知的条件，默认情况下只有A、B两项，这里可以设置触发级别、主机组、主机、触发值、应用等。举例说明下：

1、可以根据告警级别进行通知，如severity 级别大于等于average时，通知OPS运维人员，级别为Disater时通知部门经理或者BOSS （这需要配置两个action）;

2、也可以根据时间进行定义，如只在工作时间进行告警通知；

3、如果你喜欢的话，也可以指定不同主机组通知到不同的人；

而且所有条件之间的关系可以是AND或者OR ，默认情况下都是AND，即所有条件都满足时，触发通知。

注：个别主机，如DB主机，晚上有备份任务导致晚上某段时间过载（同时又不是所有主机都这样，又不想增大触发条件的话），可以在configuation －－－hosts 里的items 选项里配置通知的时间范围，那里也有 time period 配置选项（从另一方面也反映了zabbix的灵活，有宏观调控，也有微观调控，适用性很强）。不过要尽可能的都在actions 里进行配置，因为这一般查看具体条件都是在这里。

下图是action的Operations部分，该项是必填项：

Operation details 是一个比较强的配置项，这里主要有三个知识点－－－Escalations、remote command 和 event acknowledged，其中Escalations、remote command比较重要。

operation details 的 step部分主要和escalations 相关，在监控场景中，如果你一天收到100+的短信告警，真有一天“狼”真来了估计你也不会注意到。有了escalations功能，可以实现如下配置（需配置多条operation）：

1、在单位时间内（step duration）发送的总的通知次数（to - from +1 次），并通知到相应的组或人；

2、假如条件1中设置的是1800秒内发送1-5 次给OPS运维人员，结果运维人员在该时间段未能处理；我们就可以再增加一个Operations，指定from 5 to 10 (第5到10条告警)通知给运维经理；我们还可以再增加，第11－15条给BOSS ，第16－20条告警时执行一个远程命令。

escalations部分，可以参看官方文档。

第二个知识点就是Operation type部分，类型可以是send message进行通知，也可以是remote command ：

remote command 可以支持的 *** 作有IPMI、Custom script、ssh、telnet、Global script （其中前两者只能在zabbix server 或 zabbix proxy上 *** 作），该功能是相当牛B的。如，检测到一个tomcat 服务404，我们就可以利用该功能重启tomcat 服务。

remote command部分可以查看官方页面。

第三个功能主要是为有值班人员或上班时间准备的一个功能，当设置这个条件时，如果一个告警的状态被设置为ACK ，则本次告警的后续通知就会停止。

在一线运维人员接到告警信息时，在zabbix 的首页上，移到相应告警提示的部分，选择主机的ACK 部分，点选 NO ，会跳出一个message的窗口，在message里输入相关信息，如：误报、因什么什么原因在调试、已通知到相关责任人等，并点击Acknowledge 提交，此时的ACK 状态会变成YES 。本次告警也将停止不再进行。直到本次告警解决，下次再次出现同样告警时，该项又会重新变成ACK 。

Acknowledge部分，可以参看官文页面。

二、maintenance 维护

在线场景中，经常会遇到这样的情况：在线产品需要进行升级或其他 *** 作，此时又不想将监控系统的完整告警功能进行全部关闭，只临时关闭在线升级主机的告警。这就可以使用zabbix的maintenance功能。具体配置方式如下：

创建maintenance的步骤为：登录 zabbix web 页面---- Configuration-----Maintenance ----- create maintenance period ，如下图所示：

第一选项卡配置的是任务名和一个大范围的时间值，其指定了维护所在的磊的时候段在什么范围。maintenance type 指定在维护期间是否仍进行数据搜集。

periods指定的时间段具体的维护时间段，和maintenace中的范围为包含关系。而period type指定了执行的类型，其类型有one time only 一次执行，也有按日、星期或月定期执行，如果是后三种方式，date项会变成具体的间隔、开始时间。无论是何种类型，都有maintenance period length型，其指定了具体每次维护的持续时间，如2小时。

hosts & groups 项太多内容，就是选择某组主机或某个主机在维护期间不进行告警通知。

1通过hosts表查找host的ID

select host,hostid from hosts where host='Zabbix server';

+---------------+--------+

| host | hostid |

+---------------+--------+

| Zabbix server | 10084 |

+---------------+--------+

2通过items表查找主的监控项和key以及itemid

select itemid,name,key_ from items where hostid=10084 and key_='web_time';

+--------+----------+----------+

| itemid | name | key_ |

+--------+----------+----------+

| 66786 | web_time | web_time |

+--------+----------+----------+

3通过itemid查询主机的监控项目

select avg(value) from trends where itemid=66786 and from_unixtime(clock)>= '2020-12-01' and from_unixtime(clock)< '2021-01-01' \G

或者存在于

select avg(value_avg) from zabbixtrends_uint where itemid=66720 and from_unixtime(clock)>= '2020-12-01' and from_unixtime(clock)< '2021-01-01' \G

1 从数据库中获取:数据库中有5张历史数据表，history开头，2张趋势表，trend开头，从趋势表中可以获取到趋势数据。

2 从Web页面获取，监控-最新数据，查看指定监控项的图形，选择时间段立刻查看趋势。

1、监控windows进程内存。在C盘中创建脚本abat，内容tasklist。

2、在zabbix客户端配置文件zabbix-agentdwinconf中添加UserParameter=aa,c:\abat。

3、在主机的监控项中添加新的监控项，这样就可以监控windows进程内存。

4、还可以通过zabbix监控网络设备，网络配置>接口/区域>区域TAB页，在“允许管理设备”里勾选“SNMP”。

5、在网络配置>高级网络配置里，找到snmp标签页，添加一条SNMP V1/V2规则。

6、用snmp进行管理，这里的设备的IP一定要在第一步“允许管理此设备的IP”范围内，用下面命令进行测试。

7、创建监控主机，选择snmp接口，默认端口为161。

8、通过在zabbix上创建监控项，配置上键值、SNMP OID、SNMP community。

9、这样就能通过监控项获取到最新数据了。

区别如下

zabbix优点：1、数据采集：可用性和性能检测，自动发现，支持agent、snmp、JMX、telnet等多种采集方式，支持主动和被动模式数据传输、支持用户自定义插件，自定义间隔收集数据2、高可用：server对设备性能要求低，支持proxy分布式监控，分布式集中管理，有自动发现功能，可以实现自动化监控；开放式接口，扩展性强，插件编写容易3、告警管理：支持多条件告警，支持多种告警方式，支持多组模板，模板继承。4、告警设置：告警周期，告警级别，告警恢复通知、告警暂停，时段阈值、支持维护周期、支持单机停用5、图形化展示：允许自定义创建多监控项视图，网络拓扑，自定义面板展示，自定义IT服务可用性6、历史数据：历史数据查询可配置，内置housekeeping数据清理机制7、安全审计：具备安全的用户审计日志，权限认证，用户可以限制允许维护的列表。zabbix缺点：1、性能瓶颈，监控系统没有低估高峰期，具有持续性和周期性，机器量越大，数据的增大会使数据库的写入成为一定的瓶颈，官网给出的单机上限5000台，届时就需要增加proxy，增加成本。2、Zabbix采集数据有pull方式，也就是server主动模式，当目标机器量大之后，pull任务会出现积压。采集数据会延迟3、项目二次开发，需要分析MySQL表结构，表结构比较复杂，通过API开发对开发能力有要求。4、内置housekeeping在执行过程中会对数据库增加压力，需要对数据库进行优化

您好，是这样的：

zabbix基本架构：

1Server

zabbix系统核心进程，轮询并捕获数据、发送通知等。是zabbix agent和zabbix proxy汇报数据的对象。server自身可远程检测网络服务。所有的前后端配置、统计信息、可 *** 作数据存储于此。包含server、前段界面和后端DB几部分。

2Agent

部署在被监控主机上用于监控本地资源和应用并向zabbix server汇报结果。使用本地系统调用故非常高效。有主动和被动两种检测模式。被动模式下agent根据server或proxy的具体请求来返回数据。主动模式下先主动由server获取监控项列表在检测并返回新的数据。采用主动或被动检测取决于相应监控项的配置。

3Proxy

可以自由选择部署或者不部署，主要用于分担server的负载。在集中化监控远程位置、分支、网络的场景中是很好的解决方案。可从被监控设备收集数据缓存在proxy本地后传递给其所属的zabbix server。proxy需要单独的数据库

以上就是关于查询zabbix数据库alerts怎么看告警的恢复时间全部的内容，包括:查询zabbix数据库alerts怎么看告警的恢复时间、zabbix 从数据库查询数据的月度平均值指标、zabbix 如何获取 host 的趋势数据等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/sjk/10187511.html

查询zabbix数据库alerts怎么看告警的恢复时间

发表评论

评论列表（0条）