[Jderobot-admin] Zabbix

Borja Mon Serrano borjamonserrano en gmail.com
Jue Nov 22 16:50:21 CET 2012


>
> Eso es todo ponerse un rato. Si quieres podemos vernos un día de la
> semana que viene y darle un repaso a lo más básico. Si quieres trastear
> por tu cuenta también estará bien :)
>

Trastearé, porque me viene bien, pero no estaría mal si pudiéramos quedar
para detallarme cosas. Así, si tuviera dudas (que seguro que las tengo)
sobre cualquier cosa las podría resolver en el momento. Yo en un principio
tengo libre "cualquier momento" fuera del martes de 18 a 20 y el miércoles
de 16 a 20, que tengo máster en ambos casos. Así que cuando mejor te cuadre
:)

Sí, error mío, entonces es un tiempo más que aceptable. Como venía de
> mirar el top del mío...
>
>    PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
> 15203 mysql     20   0 5212m 4.6g 7100 S  107 59.1   9661:49 mysqld
>   4579 root      20   0  355m 304m 1404 S    3  3.8   1607:45 snmptrapd
>
> Llega un punto en el que te quita los decimales de los procesos que
> llevan mucho funcionando x)
>

Jeje, normal. Bueno es saber también cómo te da la información en caso de
tener procesos con tantísimo tiempo de ejecución...

50 es un número arbitrario, un equilibrio entre la carga de CPU, memoria
> y disco de matar y levantar un proceso nuevo y limitar el tiempo de
> ejecución de un proceso para minimizar problemas de corrupción de memoria.
>
> Cuanta más carga tenga un servidor hay que buscar el equilibrio entre
> aumentar ese número y también aumentar el número de procesos
> trabajadores que sirven peticiones para reducir el número de veces que
> se reciclan los hijos (para que no afecte al rendimiento general de la
> máquina).
>
> En una máquina que sirve una página por segundo, con 10 imágenes, hojas
> de estilos, javascript, etc se reciclaría un hijo cada 5 segundos, que
> no carga absolutamente nada la máquina, quizá si la cosa empieza a
> cargarse hasta empezar a reciclar 50 hijos por segundo hay que pensar en
> aumentar tanto los hijos como el número de peticiones máximas que sirven
> para espaciarlos.
>

Bueno, en cualquier caso me parece un número que está bien, en un principio
el servidor no debería de tener una carga excesiva. Al fin y al cabo somos
alrededor de 100 usuarios registrados en el LDAP y muchos de ellos están
inactivos...

El que escribe los logs es el proceso syslogd que posiblemente pueda
> estar bloqueado en operaciones de entrada/salida debido a la paginación,
> así que aunque dé la orden de escribir en el log que va a reiniciar la
> máquina posiblemente no llegue a escribirse ni aunque se retrasara
> varios segundos el reset.
>

Ya, después de enviar el correo me he dado cuenta de que no tenía mucho
sentido lo que preguntaba.

Yo cambiaría primero el swappiness a un valor bajo y el tamaño del swap
> se puede modificar en cualquier momento de forma muy rápida:
>
> 1.- Desactivamos el dispositivo de paginación: swapoff /dev/xxx
> 2.- Lo formateamos con un tamaño inferior al tamaño de la partición (en
> este caso 1 GB, el tamaño se da en KB): mkswap /dev/xxx $((1*1024*1024))
> 3.- Activamos de nuevo el dispositivo de paginación: swapon /dev/xxx
>
> mkswap por defecto usa todo el dispositivo (partición) como área de
> intercambio, pero se puede especificar un tamaño inferior si se desea
> como segundo parámetro.
>

El swappiness está puesto a 2 desde hace varios días, tal y como comentaste
en un correo anterior. En cuanto a lo de la swap, convendría "guardar" ese
espacio sobrante por si en algún momento se hiciera necesario ponerlo como
swap, ¿no? Quiero decir, que si ahora mismo bajamos la swap de 1.6 a 1GB
esos 600MB será mejor que se queden "colgando" por si hiciesen falta en el
futuro (imagínate que se instala otro módulo de memoria RAM de 1 ó 2GB...).

Aún así sigo sin poder acceder a la página:
> http://jderobot.org/index.php/Oscar_Garcia_WP
>
> :(
>

Lo sé, es lo primero que fui a mirar en cuanto reparé la tabla. Es algo que
me preocupa, porque en este caso sabemos perfectamente que esa página tuya
no la sirve (y sí, es una jodienda), pero no sabemos si hay por ahí alguna
otra en el mismo estado... Es algo que habría que revisar más en
profundidad. Espero que se pueda arreglar esto después del fsck. Hablando
del fsck, lo voy a hacer el lunes por la mañana, que tengo reunión con José
María, y así puedo ver en directo los resultados del fsck.

¿Cuál es la URL del zabbix?
>

La tienes en [1].

Como mínimo debería haber un usuario administrador y otro de sólo
> lectura que reciba alertas por email cuando se produzcan eventos (se
> dispare algún iniciador) que habitualmente es un operador.
>
> Para configurar envíos por correo electrónico debes ir a Administración
>  > Tipos de medios y editar el Email para agregar el servidor de correo,
> remitente, etc. El servidor SMTP debe tener abierto el envío de correos
> sin autenticación desde la IP del servidor o bien montar un servidor
> local que sólo acepte envío de correos originados desde localhost.
>
> Por desgracia zabbix no es capaz de enviar SMTP autenticado sin el uso
> de un script externo.
>
> Una vez configurado "el medio de comunicación" del email ya se podrá
> usar en los usuarios un destinatario (o varios) de correo y el horario
> de recepción de mensajes (yo siempre lo dejo en 24x7) pulsando en añadir
> medios.
>
> También se puede configurar un módem GSM (o un móvil que lo soporte)
> para enviar avisos SMS en vez de correos electrónicos. Así es como lo
> tenemos aquí para avisar a los VIPs (directivos y responsables de áreas
> de negocio), a los administradores de sistemas y operadores todos los
> avisos son por email (a ver si se estiran un poco :).
>
> Por último hay que configurar en "configuración" las "acciones" que
> conllevarán el envío de un aviso por correo a ese usuario.
>
> Le das a crear acción y puedes crear uno genérico que envíe correos
> cuando la gravedad del iniciador sea superior o igual a "Medio" (dándole
> a agregar condición). Luego debes agregar una acción (a la derecha)
> dándole a añadir y eligiendo enviar un email a un usuario, a un grupo o
> a una combinación de uno o varios usuarios y grupos.
>
> Ya está, con esta pequeña mini-guía habrás conseguido que zabbix te
> avise por email cuando ocurran eventos predeterminados. El segundo paso
> es crear nuestros monitores propios e iniciadores
>
> Procura hacerlo en plantillas nuevas creadas por ti, no modifiques las
> plantillas por defecto, así te será más fácil localizar tus
> modificaciones/trabajos/creaciones/pruebas/etc entre tropecientos
> monitores/iniciadores/etc que pueda contener cada plantilla.
>

Lo miraré todo con calma :)

Un saludo,

Borja.

[1] - http://jderobot.org/zabbix
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: http://gsyc.escet.urjc.es/pipermail/jderobot-admin/attachments/20121122/69c05e59/attachment-0001.htm 


More information about the Jderobot-admin mailing list