[Jderobot-admin] Servidor saturado

Oscar Garcia oscar.robotica en linaresdigital.com
Sab Abr 27 17:37:57 CEST 2013


El 26/04/13 17:05, Borja Mon Serrano escribió:
> atk0110-acpi-0
> Adapter: ACPI interface
> Vcore Voltage:      +1.10 V  (min =  +0.80 V, max =  +1.60 V)
>   +3.3 Voltage:      +3.30 V  (min =  +2.97 V, max =  +3.63 V)
>   +5 Voltage:        +5.02 V  (min =  +4.50 V, max =  +5.50 V)
>   +12 Voltage:      +12.26 V  (min = +10.20 V, max = +13.80 V)
> CPU FAN Speed:     2812 RPM  (min =  600 RPM)
> CHASSIS1 FAN Speed:   0 RPM  (min =  600 RPM)
> CHASSIS2 FAN Speed:1739 RPM  (min =  600 RPM)
> POWER FAN Speed:      0 RPM  (min =  600 RPM)
> CPU Temperature:   +100.0°C  (high = +60.0°C, crit = +95.0°C)
> MB Temperature:     +43.0°C  (high = +45.0°C, crit = +95.0°C)
>
> Una bestialidad. La CPU está que arde.


Es normal cuando se ha pasado la CPU al 100% durante tantas horas y la 
habitación en la que está no es un lugar acondicionado. El aire de la 
habitación se va calentando poco a poco y cada vez le cuesta más 
refrigerarse, ni con un disipador grande ni bueno ni nada se conseguirá 
enfriar el equipo si la habitación no dispone de un sistema 
refrigeración (aire acondicionado, por ejemplo).


>  Estoy convencido de que por eso
> tarda tanto en hacer cualquier cosa, haciendo que haya procesos apache
> que se queden por ahí colgando y le sea difícil a la máquina pararlos.


La temperatura de la CPU no influye en que la máquina esté paginando o 
no, es un efecto secundario de estar trabajando durante mucho tiempo a 
toda velocidad e irse perdiendo la eficiencia de la refrigeración por el 
aumento de la temperatura ambiente de la habitación.



> Creo que habría que empezar por resolver este problema, ya que hasta
> ahora (casualidades de la vida, hasta hace nada no ha empezado a hacer
> más o menos buen tiempo, y en el despacho de José María hace un calor
> horrible) no ha habido problema... Yo tengo pasta térmica en mi casa,
> podríamos empezar por cambiar la que tiene (a mí siempre me ha ido muy
> bien cuando la he cambiado). Quizá otro disipador no vendría mal... Una
> buena combinación de pasta térmica buena + disipador bueno hace que la
> temperatura del ordenador no sea nada alta (en mi ordenador de
> sobremesa, en invierno no subía de los 19ºC y en verano no pasaba de los
> 30ºC, y no es que me haya gastado una pasta en ello precisamente, porque
> el disipador me costó 17€, pero era un muy buen disipador).


Ya te he explicado el motivo por el que un disipador no hará gran cosa.



> Por otra parte, he mirado el log y he visto que las arañas están
> indexando el mediawiki...
>
> [Fri Apr 26 05:11:07 2013] [error] [client 66.249.75.227] File does not
> exist: /var/www/mediawiki-1.18.1/robots.txt
>
> Y, a partir de ahí, muchísimos errores como el que sigue:
>
> [Fri Apr 26 05:52:10 2013] [error] [client 77.88.26.26] PHP Notice:
> Undefined variable: output in
> /var/www/mediawiki-1.18.1/extensions/video/video.php on line 31


Son advertencias de programación, estás mirando en el log equivocado (en 
el error log). Debes mirar en el access log para ver qué páginas se 
estaban visitando para intentar deducir de ellas cuál podría estar 
creando el problema.

Si tuviéramos un frontal o acelerador (como squid o ngix) éste nos 
informaría de qué URLs dan timeout, pero al tener el servidor web 
directamente de cara a Internet no podemos saber si llega o no a 
escribirse en el log de apache el acceso a una página que deja colgado 
el proceso.



> Ahora mismo jderobot está en pie, pero con este calor y la temperatura
> que tiene no sé yo si aguantará todo el finde. Recemos porque así sea.
> Por otra parte, la migración a una nueva wiki lo mismo es lo más
> recomendable también.


Más sencillo todavía.

Nosotros usamos un script externo en zabbix que cambia el gobernador de 
las CPUs en caso de sobrecalentamiento de ondemand a powersave y luego 
vuelve a ondemand cuando la temperatura se recupera.

En esta página puedes ver cómo se puede configurar (supongo que vendrán 
los comandos de cpufreq que uso en mi script):
http://wiki.debian.org/HowTo/CpuFrequencyScaling
http://en.gentoo-wiki.com/wiki/CPU_Frequency_Scaling

Al ponerlo en powersave la CPU se pondrá a trabajar al mínimo de su 
frecuencia, por lo que la temperatura que generará será inferior incluso 
si se pone al 100% durante mucho tiempo.

He visto un Intel Xeon de 3,4 GHz trabajar durante varias horas en modo 
powersave tras saltar una alarma iLO de ventilador parado hasta que se 
le ha sustituido por otro nuevo (en caliente, sin parar la máquina) y no 
se ha quemado la CPU ni ha subido de 30 grados su temperatura. También 
he de decir que en el CPD siempre hay unos 16 grados, eso también ayuda.

Te recomiendo o bien que pongas la CPU en powersave hasta que puedas 
arreglar el problema de temperatura o bien que limites la velocidad 
máxima a la que ondemand puede poner la CPU (poner maxfreq a 50%, por 
ejemplo, en vez de al 100%).

Un saludo.


More information about the Jderobot-admin mailing list