[Jderobot-admin] Caída de zabbix_server este fin de semana

Oscar Garcia oscar.robotica en linaresdigital.com
Mar Dic 4 14:52:50 CET 2012


El 04/12/2012 14:07, Oscar Garcia escribió:
> ¿Puedo probar ahora el ab? Por lo pronto esa URL sigue sin poder cargarse.
> Me temo que el problema no ha quedado resuelto con el cambio de hardware.


Bueno, he hecho una prueba gradual para no petar del todo el servidor y 
ha ido bastante bien (relativamente hablando).

El comando no ha hecho paginar al servidor, ha logrado levantar 120 
procesos de apache2 sin ralentizarse (se notan esos gigas de ram 
adicionales), casi ni se ha inmutado la carga del servidor (apenas ha 
llegado a 25) y el uso de CPU se ha reducido apenas un par de minutos 
después de ejecutar el comando.

Sin embargo ha vuelto a caer la conexión con el servidor MySQL debido a 
excesivas conexiones. El resultado del comando ha sido:

    explotacion en zabbix-cyr:~$ ab -r -c 40 -n 120
    http://jderobot.org/index.php/Oscar_Garcia_WP
    This is ApacheBench, Version 2.3 <$Revision: 655654 $>
    Copyright 1996 Adam Twiss, Zeus Technology Ltd, http://www.zeustech.net/
    Licensed to The Apache Software Foundation, http://www.apache.org/

    Benchmarking jderobot.org (be patient)...apr_poll: The timeout
    specified has expired (70007)


De nuevo 40 conexiones simultáneas al servidor web han hecho llegar al 
límite de 100 conexiones al servidor MySQL, pero no se puede considerar 
realmente una caída del servidor MySQL, ha sido simplemente una parada 
de servicio corta.

Borja, creo que aún con el servidor nuevo hay que arreglar ese servidor 
de bases de datos, aunque estoy empezando a sospechar que no sea 
realmente cosa del servidor de bases de datos ya que el uso de CPU más 
grande lo hace el proceso apache2 y no el mysql, por lo que temo que 
algo dentro del script PHP (que se ejecuta dentro del proceso apache2) 
hace que se quede en un bucle infinito o algo similar.

¿Podrías mirar el error.log del apache para averiguar qué scripts están 
siendo detenidos por exceso de tiempo de ejecución, en qué script PHP y 
en qué línea? Creo que con ese dato podríamos averiguar dónde se genera 
el problema.

Dejé de tener acceso a esa página (aproximadamente, no recuerdo cuándo 
fue exactamente) poco después de los cambios en la wiki (lo del ldap, 
páginas privadas, etc), quiero descartar que alguna modificación en el 
código esté produciendo el problema.

Un saludo.
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: http://gsyc.escet.urjc.es/pipermail/jderobot-admin/attachments/20121204/99183e15/attachment.htm 


More information about the Jderobot-admin mailing list