Diversos parâmetros de configuração definem como o Zabbix Server irá agir quando uma verificação de agente (Zabbix, SNMP, IPMI, JMX) falhar e um host passar a se tornar inacessível.
Uma interface de host é tratada como inacessível após uma falha na verificação (rede error, timeout) pelos agentes Zabbix, SNMP, IPMI ou JMX. Observe que o Zabbix as verificações ativas do agente não influenciam a disponibilidade da interface de forma alguma.
A partir desse momento, UnreachableDelay define com que frequência uma interface é verificado novamente usando um dos itens (incluindo regras LLD) neste situação de inacessibilidade e tais verificações já serão realizadas por pollers inacessíveis (ou pollers IPMI para verificações de IPMI). Por padrão é 15 segundos antes da próxima verificação.
No log do servidor Zabbix, a inacessibilidade é indicada por mensagens como esses:
O item do agente Zabbix "system.cpu.load[percpu,avg1]" no host "Novo host" falhou: primeiro erro de rede, aguarde 15 segundos
Item do agente Zabbix "system.cpu.load[percpu,avg15]" no host "Novo host" falhou: outro erro de rede, aguarde 15 segundos
Observe que o item exato que falhou é indicado e o tipo de item (agente Zabbix).
O parâmetro Timeout também afetará o quão cedo um interface é verificada novamente durante a inacessibilidade. Se o tempo limite for 20 segundos e UnreachableDelay 30 segundos, a próxima verificação será em 50 segundos segundos após a primeira tentativa.
O parâmetro UnreachablePeriod define por quanto tempo a inacessibilidade período é total. Por padrão, UnreachablePeriod é de 45 segundos. UnreachablePeriod deve ser várias vezes maior que UnreachableDelay, para que uma interface seja verificada mais de uma vez antes de uma interface fica indisponível.
Quando o período de inacessibilidade termina, a interface é sondada novamente, diminuindo a prioridade para o item que tornou a interface inacessível Estado. Se a interface inacessível reaparecer, o monitoramento retorna ao normal automaticamente:
Uma vez que a interface se torna disponível, o host não pesquisa todos seus itens imediatamente por dois motivos:
Assim, após a disponibilização da interface, os itens não são pesquisados imediatamente, mas eles estão sendo remarcados para a próxima votação volta.
Após o término do UnreachablePeriod e a interface não reaparecer, a interface é tratada como indisponível.
No log do servidor é indicado por mensagens como estas:
desabilitando temporariamente as verificações do agente Zabbix no host "Novo host": interface indisponível
E no frontend o ícone de disponibilidade do host vai de verde/cinza para amarelo/vermelho (o detalhes de interface inacessíveis podem ser vistos na caixa de dicas que é exibido quando um mouse é posicionado no ícone de disponibilidade do host):
O parâmetro UnavailableDelay define com que frequência uma interface é verificado durante a indisponibilidade da interface.
Por padrão, são 60 segundos (então, neste caso, "desativando temporariamente", da mensagem de log acima, significará desabilitar as verificações por um minuto).
Quando a conexão com a interface é restaurada, o monitoramento retorna ao normal automaticamente também: