いくつかの設定パラメータは、エージェントチェック(Zabbix、SNMP、IPMI、JMX)が失敗したときや、ホストに接続不可能になったときに、Zabbix サーバがどのようにふるまうかを定義します。
エージェントチェックの失敗(ネットワークエラー、タイムアウト)の後は、ホストは接続不可能として扱われます。
その瞬間から、UnreachableDelay でこの接続不可能な状態でどれくらいの頻度でそのアイテムを再チェックするかを定義し、接続不可能なポーラーによってその再チェックが実行されます。デフォルトでは、次のチェックまでの間隔は15秒です。
Zabbix サーバのログでは、接続不可能な状態は次のようなメッセージで示されます:
Zabbix agent item [system.cpu.load[percpu,avg1]] on host [New host] failed: first network error, wait for 15 seconds
Zabbix agent item [system.cpu.load[percpu,avg15]] on host [New host] failed: another network error, wait for 15 seconds
失敗した正確なアイテムとアイテムタイプ(Zabbix エージェント)が示されることに注意してください。
また、接続不可能なときは、「Timeout」パラメータも、いかに早くアイテムが再チェックされるかに影響します。Timeout が20秒、UnreachableDelay が30秒の場合、最初の再チェックの試行の後、次のチェックは50秒以内に試行されます。
UnreachablePeriod パラメータは、接続不可能な期間の合計時間を定義します。
UnreachablePeriod の期間が経過した後もホストが再び現れないと、そのホストは無効として扱われます。
サーバのログには次のようなメッセージで示されます:
そして、フロントエンドでは、ホストの可用性のアイコンが緑色から赤色に変わります(マウスをその上に移動すると、エラーの説明のツールチップが表示されます):
デフォルトでは、UnreachablePeriod は45秒です。ホストが無効になる前に、アイテムが何度か再チェックされるように、UnreachablePeriod は、UnreachableDelay より数倍大きく設定するようにします。
UnavailableDelay パラメータは、ホストが無効なときのアイテムのチェックの頻度を定義します。
デフォルトでは、60秒です(したがって、の場合、上記のログのメッセージの「temporarily disabling(一時的に無効)」とは、1分間チェックが無効になるということを意味します。)
ホストへの接続が再保存されると、監視は自動的に通常に戻ります:
本ページは2013/06/02時点の原文を基にしておりますので、内容は必ずしも最新のものとは限りません。
最新の情報は右上の「Translations of this page」から英語版を参照してください。