12 Elérhetetlen/nem elérhető gazdagép interfész beállításai

Áttekintés

Többféle konfiguráció parameters határozza meg, hogy a Zabbix hogyan A szervernek akkor kell viselkednie, ha egy ügynökellenőrzés (Zabbix, SNMP, IPMI, JMX) sikertelen és egy gazdagép interfész elérhetetlenné válik.

Unreachable interface

A host interface is treated as unreachable after a failed check (network error, timeout) by Zabbix, SNMP, IPMI or JMX agents. Note that Zabbix agent active checks do not influence interface availability in any way.

From that moment UnreachableDelay defines how often an interface is rechecked using one of the items (including LLD rules) in this unreachability situation and such rechecks will be performed already by unreachable pollers (or IPMI pollers for IPMI checks). By default it is 15 seconds before the next check.

In the Zabbix server log unreachability is indicated by messages like these:

Zabbix agent item "system.cpu.load[percpu,avg1]" on host "New host" failed: first network error, wait for 15 seconds
       Zabbix agent item "system.cpu.load[percpu,avg15]" on host "New host" failed: another network error, wait for 15 seconds

Note that the exact item that failed is indicated and the item type (Zabbix agent).

The Timeout parameter will also affect how early an interface is rechecked during unreachability. If the Timeout is 20 seconds and UnreachableDelay 30 seconds, the next check will be in 50 seconds after the first attempt.

The UnreachablePeriod parameter defines how long the unreachability period is in total. By default UnreachablePeriod is 45 seconds. UnreachablePeriod should be several times bigger than UnreachableDelay, so that an interface is rechecked more than once before an interface becomes unavailable.

Interfész visszakapcsolása elérhetőre

Amikor az elérhetetlenségi időszak lejár, a felület újra lekérdezésre kerül, csökkenő prioritás azoknál az elemeknél, amelyek miatt a felület elérhetetlenné vált állapot. Ha az elérhetetlen interfész újra megjelenik, a figyelés visszatér a következőhöz normál automatikusan:

a Zabbix ügynök ellenőrzésének folytatása a gazdagépen "Új gazdagép": a kapcsolat helyreállt

Amint az interfész elérhetővé válik, a gazdagép nem kérdez le mindent két okból azonnal a tételei:

  • Túlterhelheti a házigazdát.
  • Az interfész visszaállítási ideje nem mindig egyezik a tervezett tétellel szavazás ütemezése.

Tehát miután a felület elérhetővé válik, az elemek nem lesznek lekérdezve azonnal, de átütemezték őket a következő szavazásra kerek.

Unavailable interface

After the UnreachablePeriod ends and the interface has not reappeared, the interface is treated as unavailable.

In the server log it is indicated by messages like these:

temporarily disabling Zabbix agent checks on host "New host": interface unavailable

and in the frontend the host availability icon goes from green/gray to yellow/red (the unreachable interface details can be seen in the hint box that is displayed when a mouse is positioned on the host availability icon):

The UnavailableDelay parameter defines how often an interface is checked during interface unavailability.

By default it is 60 seconds (so in this case "temporarily disabling", from the log message above, will mean disabling checks for one minute).

When the connection to the interface is restored, the monitoring returns to normal automatically, too:

enabling Zabbix agent checks on host "New host": interface became available