Ver Mensaje Individual
  #1 (permalink)  
Antiguo 07/11/2007, 14:53
opaliz
 
Fecha de Ingreso: noviembre-2007
Mensajes: 26
Antigüedad: 17 años, 3 meses
Puntos: 0
ayuda a novato - diagnóstico vps overload

Hola foreros,

hace poco me mudé de un plan revendedor a un VPS, hasta el momento todo bien, sólo que de vez en cuando el sitio se me cae y no se muy bien porqué, si alguien con mas experiencia me tira algún dato estaré agradecido.

El sitio tiene mas o menos 3.000 visitas diarias y está hecho con drupal pero con el caché agresivo, por lo que la carga del servidor no debería ser elevada, y normalemente es esta:



Por lo poco que entiendo, lo que importa es que no esté cargado mucho el cpu ni se use mucho la memoria swap, que sería la memoria virtual que es la mas lenta. En este caso parece que se usa poco.

Sin embargo hoy estaba viendo la página y se cayó. Con suerte pude entrar a whm y decía que el "server load" estaba alto y que cpsrvd falló. Al mismo tiempo comecé a recibir emails con
Cita:
cpsrvd failed @ Wed Nov 7 23:46:13 2007. A restart was attempted automagically.
El uso de recursos era el siguiente:

Código:
top - 23:13:40 up 14:03,  1 user,  load average: 30.41, 31.61, 17.73
Tasks: 341 total,   1 running, 340 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.9% us,  1.2% sy,  0.0% ni,  0.0% id, 97.9% wa,  0.0% hi,  0.0% si
Mem:   2044896k total,  2030936k used,    13960k free,    14720k buffers
Swap:  4096524k total,  2986956k used,  1109568k free,   206912k cached
Parece que acá se está usando mucho la memoria swap.

también recibí el siguiente mensaje:
Cita:
Broadcast message from root (Wed Nov 7 23:43:53 2007):

The system is going down for system halt NOW!
El uso de la memoria fue durante la caida:
Código:
             total       used       free     shared    buffers     cached
Mem:          1996       1203        793          0         23        217
-/+ buffers/cache:        962       1034
Swap:         4000       3093        907
y luego bajó a
Código:
             total       used       free     shared    buffers     cached
Mem:          1996       1888        108          0        100        651
-/+ buffers/cache:       1136        860
Swap:         4000         60       3939
Luego el sitio comenzó a andar nuevamente, pero se cayó de nuevo, esta vez aparentemente por usar mucho cpu:

[/ode]
top - 00:22:55 up 37 min, 1 user, load average: 55.64, 36.54, 18.66
Tasks: 200 total, 27 running, 173 sleeping, 0 stopped, 0 zombie
Cpu(s): 50.0% us, 50.0% sy, 0.0% ni, 0.0% id, 0.0% wa, 0.0% hi, 0.0% si
Mem: 2044896k total, 1870872k used, 174024k free, 20552k buffers
Swap: 4096524k total, 62160k used, 4034364k free, 249928k cached

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
30510 fedeanz3 17 0 47756 4576 3424 R 2 0.2 0:00.02 php
30507 fedeanz3 18 0 14536 3000 2412 R 1 0.1 0:00.01 php
1 root 15 0 1632 596 516 S 0 0.0 0:00.04 init
1700 root 18 0 6248 4444 1112 S 0 0.2 0:00.00 cpbandwd
[/code]
Curiosamente no veo ningún proceso que use el cpu o la memoria intensivamente.


Bueno, no estoy siempre monitoreando el sitio, pero parece que esto debe suceder frecuentemente porque los emails con cpsrvd failed los recibo todos los días. Actualizé cpanel pero no solucionó nada. Ahora hace varias horas que tengo el sitio caído, a pesar de que fue reiniciado.

Alguien me tira algún dato para ver donde puede estar la causa de esto y que se puede intentar para solucionarlo?