Blogia
Blog de Ibercivis

Monitoreando

Los comentarios siguen llegando, pero no se por que el estilo de blogia da problemas y no se visualizan fuera de administracion. Estamos esperando que lo solucionen definitivamente. Hay dos razones para tener el blog fuera: una, no reinventar la rueda. y otra, poder comunicarnos en caso de emergencia de nuestras maquinas o incluso de rediris.

Bueno, a lo que iba. Hoy hemos puesto en la web, en la seccion de estadisticas, los datos "crudos" de ancho de banda y carga de las maquinas. La maquina "lxbifi25" es www, la "lxbifi26" es registro y bajada, la del CETA es subida, y nuestro  escaso java se ejecuta en la 39.  Asi que los mas  interesantes son 25, que hace muchos analisis de la base de datos (recordad que esta fuera del circulo) y 26, que en su papel de "registro" produce trabajos. Las metricas propias tienen la etiqueta icvis_. Otro dia las pondremos mas bonitas, cuando dominemos el rrdtool, y entonces os explicare lo que es cada una. De momento ahi estan.

10 comentarios

andrea.p -

Respecto al comentario anterior estos son los mensajes recibidos, posteriormente no descarga nada y se queda sin trabajo:

vie 25 jul 2008 19:42:45 CEST

andrea.p -

Como comenta Algol, yo también tengo muchos problemas con materiales (linux 64) los ordenadores se pueden quedar horas descargando las unidades, mientras tanto se quedan sin trabajo y no hacen nada más. Tengo que reiniciar el proyecto para poder obtener trabajos de otros subproyectos.
Saludos.

Deuvedé -

Respecto a que las workunits de docking duran poco nada puedo hacer. Los investigadores de docking deberían darse cuenta de que les sale más a cuenta enviar más de una molécula por workunit, pero hace falta cambiar la aplicación para eso.

Los errores de descarga de materiales son extraños. He cogido alguno al azar y los inputs están en su sitio y si copio el url de la base de datos al firefox puedo descargar el archivo a mano correctamente. Pero seguire investigando a ver si encuentro algo.

algol -

Hola de nuevo.

Con respecto a los problemas de descarga, ocurren solamente en las unidades de materiales, y a mi me ocurren muchos mas en linux (en que casi todas las descargas son fallidas) que en windows.

Por otra parte, si un ordenador quad-core (e incluso un dual-core) que no puede descargar unidades de materiales se centra en docking, se quedará sin trabajo pues obtiene solamente 3 unidades cada 6 minutos, y el promedio de proceso de las unidades de docking es de unos 2-3 minutos.

Salu2.

Fer.

algol -

Hola.

Lo que le pasó a Jorge Mena me pasó también a mi, y a algún compañero de equipo. Si el servidor devuelve ese mensaje quiere decir que desde Ibercivis (el usuario final no puede modificar ese dato) se puso la cuota de resultados diarios en 100 por core (es decir, 400 para un quad), en vez de en 1000 como está ahora.

Hoy tenemos algunos problemas de descarga con las unidades de materiales.

Salu2.

Fer.

Deuvedé -

ManuelBV: Sí, intentamos que no ocurra, pero a veces pasa.

Jorge Mena: El primer mensaje habla por sí solo. Pero no sé porque se queja de 400 si la cuota es 1000. Respecto al segundo, ni idea, el tiempo de espera son 5 minutos.

manuelBV -

Desde ayer no me envía trabajos a ninguna de las máquinas.

Jorge Mena -

A otra máquina me dice:

Message from server: Not sending work - last request too recent: 29910 sec

8,5 horas...

Jorge Mena -

(El anterior se ha cortado, lo continuo aquí)

Message from server: (reached daily quota of 400 results)

También me dice que no hay trabajos disponibles para las aplicaciones, aunque al resto de máquinas si que les llegan.

Jorge Mena -

No me descarga trabajos en una de mis máquinas:
http://registro.ibercivis.es/show_host_detail.php?hostid=530

Me dice:
mar 22 jul 2008 02:55:02 CEST