5 Ескалације

Преглед

Уз ескалације можете креирати прилагођене сценарије за слање обавештења или извршавање даљинских команди.

У практичном смислу то значи да:

  • Корисници могу бити одмах обавештени о новим проблемима.
  • Обавештења се могу понављати док се проблем не реши.
  • Слање обавештења може бити одложено.
  • Обавештења се могу ескалирати на другу "вишу" групу корисника.
  • Даљинске команде се могу извршити одмах или када проблем није решено на дужи период.

Радње се ескалирају на основу корака ескалације. Сваки корак има а трајање у времену.

Можете дефинисати и подразумевано трајање и прилагођено трајање ан индивидуални корак. Минимално трајање једног корака ескалације је 60 секунди.

Можете започети радње, као што је слање обавештења или извршавање команде, из било ког корака. Први корак је за хитне акције. Ако желиш да бисте одложили радњу, можете је доделити каснијем кораку. За сваки корак, може се дефинисати неколико радњи.

Број корака ескалације није ограничен.

Ескалације се дефинишу када конфигуришете ан операција. Ескалације су подржано само за проблематичне операције, не и за опоравак.

Разни аспекти понашања ескалације

Хајде да размотримо шта се дешава у различитим околностима ако нека акција садржи неколико корака ескалације.

Situation Behavior
Дотични домаћин улази у одржавање након што се пошаље почетно обавештење о проблему У зависности од подешавања Паузирај операције за потиснуте проблеме у акцији конфигурација, сви преостали кораци ескалације се извршавају или са закашњењем узрокованим периодом одржавања или без одлагања. Период одржавања не отказује операције.
Временски период дефинисан у услову акције Временски период се завршава након слања почетног обавештења Сви преостали кораци ескалације се извршавају. Услов Временски период не може зауставити операције; има ефекат у односу на то када су акције покренуте/непокренуте, а не операције.
Проблем почиње током одржавања и наставља се (није решен) након завршетка одржавања У зависности од поставке Паузирај операције за потиснуте проблеме у акцији конфигурација, сви кораци ескалације се извршавају или од тренутка завршетка одржавања или одмах.
Проблем почиње током одржавања без података и наставља се (није решен) након завршетка одржавања Мора сачекати да се окидач активира, пре него што се изврше сви кораци ескалације.
Различите ескалације следе у блиском низу и преклапају се Извршавање сваке нове ескалације замењује претходну ескалацију, али за најмање један корак ескалације који се увек извршава на претходној ескалацији. Ово понашање је релевантно у акцијама на догађаје који се креирају са СВАКИМ проблемом евалуације окидача.
Током ескалације у току (као што је порука која се шаље), на основу било које врсте догађаја:
- радња је онемогућена
Засновано на догађају покретача:
- окидач је онемогућен
- домаћин или ставка су онемогућени
На основу интерног догађаја о окидачима:
- окидач је онемогућен
На основу интерног догађаја о ставкама/правила откривања ниског нивоа:
- ставка је онемогућена
- домаћин је онемогућен
Порука у току се шаље, а затим се шаље још једна порука о ескалацији. Следећа порука ће имати текст за отказивање на почетку тела поруке (НАПОМЕНА: Ескалација је отказана) са именом разлога (на пример, НАПОМЕНА: Ескалација је отказана: акција '<Action name>' онемогућена). На овај начин прималац је обавештен да је ескалација отказана и да више неће бити извршени кораци. Ова порука се шаље свима који су раније примили обавештења. Разлог отказивања се такође евидентира у фајлу евиденције сервера (почевши од Ниво отклањања грешака 3=Warning).

Имајте на уму да је порука Ескалација отказана такође шаље се ако су операције завршене, али су операције опоравка конфигурисане и још се не извршавају.
Током ескалације у току (као што је порука која се шаље) акција се брише Нема више порука. Информације се евидентирају у фајл евиденције сервера (почевши од Ниво за отклањање грешака 3=Warning), на пример: escalation canceled: action id:334 deleted

Примери ескалације

Пример 1

Слање поновљеног обавештења сваких 30 минута (укупно 5 пута) у групу "MySQL администратори". Да бисте конфигурисали:

  • На картици Операције подесите Подразумевано трајање корака операције на "30m" (30 минута).
  • Подесите ескалацију Кораци да буде од "1" до "5".
  • Изаберите групу "MySQL администратори" као примаоце поруке.

Обавештења ће бити послата у 0:00, 0:30, 1:00, 1:30, 2:00 сата након проблем почиње (осим ако се, наравно, проблем не реши раније).

Ако је проблем решен и конфигурисана порука за опоравак, биће бити послате онима који су примили барем једну поруку о проблему у оквиру овога сценарио ескалације.

Ако је окидач који је генерисао активну ескалацију онемогућен, Zabbix шаље информативну поруку о томе свима онима који већ су примили обавештења.

Пример 2

Слање одложеног обавештења о дуготрајном проблему. То конфигурисати:

  • На картици Операције подесите Подразумевано трајање корака операције на "10h" (10 сати).
  • Подесите ескалацију Кораци да буде од "2" до "2".

Обавештење ће бити послато само у кораку 2 сценарија ескалације, или 10 сати након што проблем почне.

Можете прилагодити текст поруке на нешто попут "Проблем је стар више од 10 сати".

Пример 3

Ескалација проблема на шефа.

У првом примеру изнад смо конфигурисали периодично слање порука за MySQL администраторе. У овом случају, администратори ће добити четири поруке пре проблема ће бити прослеђене менаџеру базе података. Имајте на уму да ће менаџер добити поруку само у случају да проблем није још увек признато, наводно нико на томе не ради.

Детаљи операције 2:

Обратите пажњу на употребу макроа {ESC.HISTORY} у прилагођеној поруци. Макро ће садржати информације о свим претходно извршеним корацима на овоме ескалације, као што су послата обавештења и извршене команде.

Пример 4

Сложенији сценарио. Након више порука MySQL администраторима и ескалације менаџеру, Zabbix ће покушати да поново покрене MySQL база података. То ће се десити ако проблем постоји 2:30 сата и то није признато.

Ако проблем и даље постоји, након још 30 минута Zabbix ће послати а порука свим гостујућим корисницима.

Ако ово не помогне, након још сат времена Zabbix ће поново покренути сервер са MySQL базу података (друга удаљена команда) користећи IPMI команде.

Пример 5

Ескалација са неколико операција додељених једном кораку и прилагођено коришћени интервали. Подразумевано трајање корака операције је 30 минута.

Обавештења ће бити послата на следећи начин:

  • MySQL администраторима у 0:00, 0:30, 1:00, 1:30 након што проблем почне.
  • Менаџеру базе података у 2:00 и 2:10. (а не у 3:00; видећи да се кораци 5 и 6 преклапају са следећом операцијом, краће трајање прилагођеног корака од 10 минута у следећој операцији замењује дуже трајање корака од 1 сата које сте покушали да подесите овде).
  • Zabbix администраторима у 2:00, 2:10, 2:20 након што проблем почне (прилагођено трајање корака од 10 минута). – Гостујућим корисницима у 4:00 сата након почетка проблема (подразумевано трајање корака од 30 минута враћа се између корака 8 и 11).