2022 Zabbix中国峰会
2022 Zabbix中国峰会

1 使用 Zabbix agent 监控Linux

介绍

本页将引导您完成使用Zabbix开始对Linux机器进行基本监控所需的步骤。 本教程中描述的步骤可应用于任何基于 Linux 的操作系统。

本指南适用于谁

本指南专为Zabbix新用户设计,包含了对Linux计算机进行基本监控所需的最少步骤集。 如果您正在寻找深度自定义选项或需要更高级的配置,请参阅Zabbix手册的 配置 部分。

先决条件

在继续本安装指南之前,您必须根据您操作系统对应的说明 下载并安装 Zabbix server和Zabbix前端。

安装Zabbix agent

Zabbix agent 是负责收集数据的程序。

检查您的Zabbix server版本:

zabbix_server -V

在要监控的Linux机器上安装相同版本 (推荐) 的Zabbix agent。 根据您的监控需求,它可能是安装Zabbix server的同一台机器, 也可能是另一台完全不同的机器。

选择最合适的安装方法:

  • 作为Docker容器运行 - 请参阅 Zabbix Docker 存储库 中的可用镜像列表。

  • 从Zabbix 软件包 安装(适用于 Alma Linux, CentOS, Debian, Oracle Linux, Raspberry Pi OS, RHEL, Rocky Linux, SUSE Linux Enterprise Server, Ubuntu).

  • 从源码编译安装。

配置Zabbix进行监控

Zabbix agent可以(同时)在主动或被动模式下收集指标。

被动检查是一个简单的数据请求。 Zabbix server或proxy会要求agent提供一些数据 (例如,CPU负载), Zabbix agent 会将结果发回服务器。 主动检查需要更复杂的处理。代理必须首先从服务器检索要独立处理的项目列表,然后批量发送回数据。 详情请参阅 被动和主动模式的agent检查

Monitoring templates provided by Zabbix usually offer two alternatives - a template for Zabbix agent and a template for Zabbix agent (active). With the first option, the agent will collect metrics in passive mode. Such templates will deliver identical monitoring results, but using different communication protocols.

Further Zabbix configuration depends on whether you select a template for active or passive Zabbix agent checks.

被动模式检查

Zabbix前端

1. 登录Zabbix前端。

2. 在Zabbix Web界面中创建主机 。 此主机将代表您的 Linux 计算机。

3. 在 接口 参数中,添加 Agent 接口,并指定安装agent的 Linux 计算机的 IP 地址或 DNS 名称。

4. 在 模板 参数中,键入或选择 Linux by Zabbix agent

Zabbix agent

打开Zabbix agent配置文件(默认路径为 /usr/local/etc/zabbix_agentd.conf ):

sudo vi /usr/local/etc/zabbix_agentd.conf

将Zabbix server的IP地址或DNS名称添加到 Server 参数中。

例如:

Server=192.0.2.22

主动模式检查

Zabbix 前端

1. 登录Zabbix前端。

2. 在Zabbix Web界面中 创建主机

此主机将代表您的 Linux 计算机。

3. 在 Templates 参数中,键入或选择 Linux by Zabbix agent active

Zabbix agent

打开Zabbix agent配置文件(默认路径为 /usr/local/etc/zabbix_agentd.conf ):

sudo vi /usr/local/etc/zabbix_agentd.conf

添加:

  • 您在 Zabbix web 界面中创建的主机的名称 Hostname 参数。
  • Zabbix server的IP地址或DNS名称设置到 ServerActive 参数.

示例:

ServerActive= 192.0.2.22
       Hostname=Linux server

查看收集的指标

恭喜!此时,Zabbix已经在监视您的Linux机器。

要查看收集的指标,请打开 监视->主机 菜单 ,然后点击主机旁边的 最新数据

此操作将打开从 Linux 服务器主机收集的所有最新指标的列表。

设置问题告警

Zabbix可以使用多种方法通知您有关基础设施的问题。 本指南提供了发送电子邮件告警的配置步骤。

1. 转到 用户设置 -> 配置, 切换到 媒体 选项卡并 添加你的邮箱地址.

2. 按照 接收问题通知 指南进行操作。

下次,当Zabbix检测到问题时,您应该会通过电子邮件收到告警。

测试配置

在 Linux 上,您可以通过运行以下命令模拟高 CPU 负载,以接收问题告警:

cat /dev/urandom | md5sum

您可能需要运行多个 md5sum 进程才能使 CPU 负载超过阈值。

当Zabbix检测到问题时,它将出现在 监控->问题 部分.

如果 配置了告警,您还将收到问题通知。

另请参阅:

  • 创建监控项 - 如何开始监控其他指标(不使用模板的自定义监控)。
  • Zabbix agent 监控项, Windows 的 Zabbix agent 监控项 - 您可以在 Windows 上使用 Zabbix agent 监控的完整指标列表。
  • 问题升级 - 如何创建多步骤警报场景(例如,首先向系统管理员发送消息,然后,如果问题在 45 分钟内未解决,则向数据中心经理发送消息)。