いくつかの設定パラメータは、エージェントチェック(Zabbix、SNMP、IPMI、JMX)が失敗し、ホストインターフェイスに到達できなくなった場合のZabbixサーバーの動作を定義します。
Zabbix、SNMP、IPMI、またはJMXエージェントによるチェックが失敗(ネットワークエラー、タイムアウト)すると、その後、当該のホストインターフェイスは到達不能として扱われます。 Zabbixエージェントのアクティブチェックは、インターフェイスの可用性にまったく影響を与えないことに注意してください。
その瞬間からUnreachableDelayは、この到達不能な状態のアイテムの1つ(LLDルールを含む)を使用してインターフェイスが再チェックされる頻度を定義します。再チェックは到達不能なポーラー(またはIPMIチェックの場合はIPMIポーラー)によって実行されます。 デフォルトでは次のチェックの15秒前です。
Zabbixサーバーでは、到達できないことを次のようなメッセージでログに書き込みます。
Zabbix agent item "system.cpu.load[percpu,avg1]" on host "New host" failed: first network error, wait for 15 seconds
Zabbix agent item "system.cpu.load[percpu,avg15]" on host "New host" failed: another network error, ait for 15 seconds
失敗した正確なアイテムとアイテムタイプ(Zabbixエージェント)が示されていることに注意してください。
Timeoutパラメーターは、到達不能時にインターフェースが再チェックされるタイミングにも影響します。 Timeoutが20秒、UnreachableDelayが30秒の場合、次のチェックは最初の試行から50秒後になります。
UnreachablePeriodパラメーターは、到達不能期間の合計の長さを定義します。 デフォルトでは、UnreachablePeriodは45秒です。 UnreachablePeriodは、UnreachableDelayの数倍の大きさである必要があります。これにより、インターフェースが使用できなくなる前に、インターフェースが複数回再チェックされます。
到達不能期間が終了すると、インターフェイスが再度ポーリングされ、インターフェイスを到達不能状態にしたアイテムの優先度が低下します。到達不能なインターフェイスが再び到達可能になると、監視は自動的に通常に戻ります。
インターフェイスが使用可能になっても、ホストは次の2つの理由ですべてのアイテムをすぐにポーリングしません。
そのため、インターフェイスが使用可能になった後、アイテムはすぐにはポーリングされず、次のポーリングラウンドに再スケジュールされます。
UnreachablePeriodの終了までにインターフェイスが到達可能に戻らなかった場合、インターフェイスは使用不可として扱われます。
サーバーログには次のようなメッセージが出力されます。
フロントエンドでは、ホストの可用性アイコンが緑/灰色から黄色/赤に変わります(使用不能なインターフェイスの詳細は、ホストの可用性アイコンにオンマウスしたときに表示されるヒントボックスに表示されます。)
UnavailableDelayパラメーターは、インターフェースが使用不可のときにインターフェースがチェックされる頻度を定義します。
デフォルトでは60秒です(したがって、この場合、上記のログメッセージから「一時的に無効にする」とは、1分間チェックを無効にすることを意味します)。
インターフェイスへの接続が復元されると、監視も自動的に通常に戻ります。