Можете пратити здравље и доступност уређаја Интеллигент Intelligent PlatformManagement Interface (IPMI) у Zabbix-у. За обављање IPMI провера Zabbix сервер мора бити првобитно конфигурисан са подршком за IPMI.
IPMI је стандардизовани интерфејс за даљинско "lights-out" или "out-of-band" управљање рачунарским системима. Омогућава праћење статуса хардвера директно са такозваних "out-of-band" управљачких картица, независно од оперативног система или да ли је машина уопште укључена.
Zabbix IPMI надгледање ради само за уређаје који имају подршку за IPMI (HPiLO, DELL DRAC, IBM RSA, Sun SSP, итд.).
Процес IPMI менаџера заказује IPMI провере од стране IPMI анкетара. Домаћин увек прозива само један IPMI полер у исто време, смањујући број отворених веза са BMC контролерима. Стога је безбедно повећати број IPMI полера без бриге о преоптерећењу BMC контролера. Процес IPMI манаџера се аутоматски покреће када се покрене најмање један IPMI полер.
Такође погледајте познати проблеми за IPMI провере.
Домаћин мора бити конфигурисан за обраду IPMI провера. Мора се додати IPMI интерфејс, са одговарајућим IP бројевима и бројевима портова, и морају бити дефинисани параметри IPMI аутентикације.
За више детаља погледајте [конфигурацију домаћина] (/manual/config/hosts/host).
Подразумевано, Zabbix сервер није конфигурисан да покреће било који IPMI полер, тако да било које додате IPMI ставке неће радити. Да бисте ово променили, отворите конфигурациону датотеку Zabbix сервера (zabbix_server.conf) као root и потражите следећи ред:
# StartIPMIPollers=0
Откачите га и подесите број анкетара на, рецимо, 3 , тако да гласи:
StartIPMIPollers=3
Сачувајте датотеку и поново покрените zabbix_server после.
Када конфигуришете ставку) на нивоу домаћина:
id:
- да бисте навели ID сензора;name:
- да бисте навели пуно име сензора. Ово може бити корисно у ситуацијама када се сензори могу разликовати само навођењем пуног имена.IPMI агент подржава уграђену ставку ipmi.get, која враћа информације везане за IPMI сензор и може се користити за откривање IPMI сензора.
Повратна вредност: JSON објекат*
Временско ограничење IPMI порука и број поновних покушаја су дефинисани у OpenIPMI библиотеци. Због тренутног дизајна OpenIPMI-а, није могуће направити ове вредности конфигурабилним у Zabbix-у, ни на нивоу интерфејса ни на нивоу ставке.
Временско ограничење неактивности IPMI сесије за LAN је 60 +/-3 секунди. Тренутно није могуће имплементирати периодично слање наредбе Активирај сесију са OpenIPMI. Ако нема провера IPMI ставки од Zabbix-а до одређеног BMC-а за више од временског ограничења сесије конфигурисаног у BMC-у, онда ће следећа IPMI провера након истека временског ограничења истећи због истека појединачних порука, поновних покушаја или грешке пријема. Након тога се отвара новинска сесија и започиње потпуно поновно скенирање BMC-а. Ако желите да избегнете непотребно поновно скенирање BMC-а, саветује се да подесите интервал анкетирања IPMI ставке испод временског ограничења неактивности IPMI сесије конфигурисаног у BMC-у.
Да бисте пронашли сензоре на домаћину, покрените Zabbix сервер са омогућеним DebugLevel=4. Сачекајте неколико минута и пронађите записе о откривању сензора у датотеци евиденције Zabbix сервера:
$ grep 'Added sensor' zabbix_server.log
8358:20130318:111122.170 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:7 id:'CATERR' reading_type:0x3 ('discrete_state') type:0x7 ('processor') full_name:'(r0.32.3.0).CATERR'
8358:20130318:111122.170 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:15 id:'CPU Therm Trip' reading_type:0x3 ('discrete_state') type:0x1 ('temperature') full_name:'(7.1).CPU Therm Trip'
8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'System Event Log' reading_type:0x6f ('sensor specific') type:0x10 ('event_logging_disabled') full_name:'(7.1).System Event Log'
8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'PhysicalSecurity' reading_type:0x6f ('sensor specific') type:0x5 ('physical_security') full_name:'(23.1).PhysicalSecurity'
8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'IPMI Watchdog' reading_type:0x6f ('sensor specific') type:0x23 ('watchdog_2') full_name:'(7.7).IPMI Watchdog'
8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:16 id:'Power Unit Stat' reading_type:0x6f ('sensor specific') type:0x9 ('power_unit') full_name:'(21.1).Power Unit Stat'
8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:16 id:'P1 Therm Ctrl %' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(3.1).P1 Therm Ctrl %'
8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:16 id:'P1 Therm Margin' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(3.2).P1 Therm Margin'
8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:13 id:'System Fan 2' reading_type:0x1 ('threshold') type:0x4 ('fan') full_name:'(29.1).System Fan 2'
8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:13 id:'System Fan 3' reading_type:0x1 ('threshold') type:0x4 ('fan') full_name:'(29.1).System Fan 3'
8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'P1 Mem Margin' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(7.6).P1 Mem Margin'
8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'Front Panel Temp' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(7.6).Front Panel Temp'
8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:15 id:'Baseboard Temp' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(7.6).Baseboard Temp'
8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:9 id:'BB +5.0V' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +5.0V'
8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'BB +3.3V STBY' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +3.3V STBY'
8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:9 id:'BB +3.3V' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +3.3V'
8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'BB +1.5V P1 DDR3' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +1.5V P1 DDR3'
8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'BB +1.1V P1 Vccp' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +1.1V P1 Vccp'
8358:20130318:111122.174 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'BB +1.05V PCH' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +1.05V PCH'
За декодирање типова и стања IPMI сензора, копија IPMI 2.0 спецификација је доступан (имајте на уму да нема даљих ажурирања на IPMI спецификацију).
Први параметар са којим треба почети је "reading_type". Користите "Table 42-1,Event/Reading Type Code Ranges" из спецификација да бисте декодирали код "reading_type". Већина сензора у нашем примеру има "reading_type:0x1" што значи сензор "прага". "Табела 42-3, Кодови типа сензора“ показује да "type:0x1" значи сензор температуре, "type:0x2" – сензор напона, "type:0x4" – Вентилатор итд. параметри као што су температура, напон, број обртаја у минути.
Још један пример - сензор са "reading_type:0h3". "Табела 42-1, Опсези кодова типа догађаја/читања" каже да читање кодова типа 02h-0Ch "Generic Discrete" сензор. Дискретни сензори имају до 15 могућих стања (другим речима - до 15 значајних битова). На пример, за сензор 'CATERR' са "type:0h7" "Табела 42-3, Кодови типа сензора" показује да овај тип значи "Процесор" и значење појединачних битова је: 00h (најмањи значајни бит) - IERR, 01h - Thermal Trip итд.
У нашем примеру постоји неколико сензора са "reading_type:0x6fф". За ове сензоре "Табела 42-1, Опсези кодова типа догађаја/читања" саветује да користите "Табелу 42-3, Кодови типова сензора" за декодирање значења битова. На пример, сензор 'Power Unit Stat'' има тип "type:0x9" што значи "Power Unit". Помак 00h значи "Искључено/искључено". Другим речима, ако је најмањи бит 1, сервер је искључен. За тестирање овог бита, може се користити ** bitand** функција са маском '1'. Израз окидача може бити као и
bitand(last(/www.example.com/Power Unit Stat,#1),1)=1
да упозорава на искључење сервера.
Имена дискретних сензора у OpenIPMI-2.0.16, 2.0.17 и 2.0.18 често имају додатну "0
" (или неку другу цифру или слово) додану на крају. На пример, док ipmitool
и OpenIPMI-2.0.19 приказују имена сензора као "PhysicalSecurity
" или "CATERR
", у OpenIPMI-2.0.16, 2.0.17 и 2.0.18 имена су "PhysicalSecurity
" или "CATERR
", односно.
Приликом конфигурисања IPMI ставке са Zabbix сервер који користи OpenIPMI-2.0.16, 2.0.17 и 2.0.18, користите ова имена која се завршавају са "0" у * IPMI сензор* пољу ставки IPMI агента. Када се ваш Zabbix сервер надогради на нову newLinux дистрибуцију, која користи OpenIPMI-2.0.19 (или новију), ставке са овим IPMI дискретним сензорима ће постати "НИСУ ПОДРЖАНЕ". Морате да промените њихова имена * IPMI сензора* (на крају уклоните '0') и сачекате неко време пре него што поново постану " Омогућено ".
Неки IPMI агенти обезбеђују и сензор прага и дискретни сензор под истим именом. Предност се увек даје сензору прага.
Ако се IPMI провере не изврше (из било ког разлога: све IPMI ставке домаћина су онемогућене/неподржане, домаћин онемогућен/избрисан, домаћин у одржавању итд.) IPMI веза ће бити прекинута са Zabbix сервера или проксија за 3 до 4 сата у зависности од времена када Zabbix сервер/прокси је покренут.