Esta sección proporciona detalles del preprocesamiento del valor de la métrica. El preprocesamiento del valor de la métrica permite definir y ejecutar reglas de transformación para los valores de las métricas recibidos.
El preprocesamiento lo gestiona el proceso del administrador de preprocesamiento junto con los trabajadores de preprocesamiento que realizan los pasos de preprocesamiento. Todos los valores (con o sin preprocesamiento) de diferentes recolectores de datos pasan por el administrador de preprocesamiento antes de ser agregados a la caché del historial. Se utiliza comunicación IPC basada en sockets entre los recolectores de datos (sondeadores, capturadores, etc.) y el proceso de preprocesamiento. Tanto el servidor Zabbix como el proxy Zabbix (para elementos monitoreados por el proxy) realizan los pasos de preprocesamiento.
Para visualizar el flujo de datos desde la fuente de datos a la base de datos Zabbix, podemos utilizar el siguiente diagrama simplificado:
El diagrama anterior muestra solo procesos, objetos y acciones relacionados con el procesamiento del valor de la métrica en forma simplificada. El diagrama no muestra cambios de dirección condicionales, manejo de errores o bucles. La caché de datos locales del administrador de preprocesamiento tampoco se muestra porque no afecta directamente el flujo de datos. El objetivo de este diagrama es mostrar los procesos. involucrados en el procesamiento del valor de la métrica y la forma en que interactúan.
Una métrica puede cambiar su estado a NO SOPORTADA mientras se realiza el preprocesamiento si alguno de los pasos de preprocesamiento falla.
Una métrica puede cambiar su estado a NO SOPORTADA si falla la normalización de datos (por ejemplo, cuando un valor textual no se puede convertir a número).
El preprocesamiento de datos se realiza en los siguientes pasos:
Tenga en cuenta que el diagrama el preprocesamiento de la métrica principal se simplifica ligeramente al omitir el almacenamiento en caché del preprocesamiento.
El procesamiento del valor de la métrica se ejecuta en múltiples pasos (o fases) mediante múltiples procesos. Esto puede causar:
Como resultado, la métrica dependiente recibe un valor, mientras que la métrica principal cambia su estado a NO SOPORTADA.
La cola de preprocesamiento está organizada como:
El almacenamiento en caché del preprocesamiento se introdujo para mejorar el rendimiento del preprocesamiento de múltiples métricas dependientes que tienen pasos de preprocesamiento similares (que es un resultado LLD común).
El almacenamiento en caché se realiza preprocesando una métrica dependiente y reutilizando algunos de los datos de preprocesamiento interno para el resto de las métricas dependientes. La caché de preprocesamiento solo se admite para el primer paso de preprocesamiento de los siguientes tipos:
[?(@.path == "value")]
)El archivo de configuración del servidor Zabbix permite a los usuarios establecer el número de subprocesos de trabajo de preprocesamiento. El parámetro de configuración StartPreprocessors debe usarse para establecer el número de instancias iniciadas previamente de trabajadores de preprocesamiento. El número óptimo de trabajadores de preprocesamiento puede ser determinado por muchos factores, incluido el recuento de métricas "preprocesables" (métricas que requieren ejecutar cualquier paso de preprocesamiento), el recuento de procesos de recopilación de datos, el recuento promedio de pasos para el preprocesamiento de métricas, etc.
Pero suponiendo que no haya operaciones de preprocesamiento pesadas, como analizar grandes fragmentos XML/JSON, la cantidad de trabajadores de preprocesamiento puede coincidir con la cantidad total de recolectores de datos. De esta manera, en la mayoría de los casos (excepto en los casos en que los datos del recopilador llegan en masa) habrá al menos un trabajador de preprocesamiento desocupado para los datos recopilados.
Demasiados procesos de recopilación de datos (sondeadores, sondeadores inalcanzables, sondeadores ODBC, sondeadores HTTP, sondeadores de Java, pingers, capturadores, proxypollers) junto con el administrador IPMI, capturador SNMP y los trabajadores de preprocesamiento pueden agotar el límite de descriptores de archivos por proceso para el gestor de preprocesamiento. Esto hará que el servidor Zabbix se detenga (normalmente poco después el inicio, pero a veces puede llevar más tiempo). El archivo de configuración debe revisarse o aumentarse el límite para evitar esta situación.