Table of Contents

8. 服务监控

概览

服务监控,作为业务级别的监控功能,可以帮助用户获得有关IT设施的整体服务架构信息、鉴别设施的薄弱之处、计算多种IT服务的SLA以及具备在更高层级查看更多信息的能力。相较于一些基础信息,诸如硬盘空间的不足,处理器过载等,业务监控更专注于业务的整体可用性。若一项业务并没有如用户所期望的那样正常运转,服务监控功能同样可以帮助用户找到引发问题的根本原因。

服务监控具备对监控数据创建层级展示的能力。

如下所示,展示了一个非常简单的服务结构:

Service
       |
       |-Workstations
       | |
       | |-Workstation1
       | |
       | |-Workstation2
       |
       |-Servers

在上述结构中的每个节点都具备属性状态。这些属性状态都是通过筛选的算法经过计算并传输至更高层级的。各个节点的状态受映射问题状态的影响而问题映射是通过 标签来实现的。

如果检测到服务状态发生变化,Zabbix 可以在 Zabbix server 上发送通知或自动执行脚本。用户可以根据子服务的状态来灵活定义父服务是否应该进入 '问题状态' 。服务问题数据可以用来计算 SLA 并灵活的设定发送 SLA 报告的条件。

业务监控在 Services(服务) 菜单中配置,该菜单由以下部分组成:

服务板块允许通过添加父服务来构建用户所监控的基础架构的层次结构,然后将子服务添加至父服务中。

除了配置服务树之外,本板块还提供了整体基础架构的概述,并允许快速识别导致服务状态更改的问题。

在本板块中,用户可以定义服务等级协议并为特定服务设置服务等级目标。

在此板块,用户可以查看 SLA 报告。

服务动作

用户同样可以配置服务动作

服务动作作为可选功能具备:

  • 当服务宕掉则发送通知;
  • 当服务状态发生改变可以在 Zabbix 服务器端远程执行命令;
  • 当服务恢复则发送恢复通知。

可参考内容:

  • SLA监控监控配置示例
  • 若用户所使用的 Zabbix 的版本低于6.0at=refs%2Fheads%2Frelease%2F7.0](https://git.zabbix.com/projects/WEB/repos/documentation/browse/en/manual/it_services.md?at=refs%2Fheads%2Frelease%2F7.0),请参考有关升级服务 的内容。