Blogia
Blog de Ibercivis

Caida de luz en el BIFI... ibercivis down

Caida de luz en el BIFI... ibercivis down

Hola a todos,

La actual caida de Ibercivis (servidor, sitio web...) no sabemos a que se debe, pero debe ser algun transformador de la red principal porque  todos los semaforos de la calle tambien estan caidos :o

Cuando volvera la luz? podemos recordar mientras tanto a enjuto mojamuto "interneeeeeet" :D

 

 

 

16 comentarios

Guiri-1 -

Entonces,si no he entendido mal,no tengo posibilidad de descargarme un buen puñado de WUs y dejarlo procesando sin conexion a internet...no hay forma?

Deuvedé -

Sí, venimos teniendo algún problema desde ayer, pero ya está casi superado. La recepción ya está activada y la validación y asimilación las arrancaremos en algún momento de la tarde cuando sincronicemos las bases de datos del anillo.

Antonio -

Hola

¿Hay de nuevo problemas hoy?

Se descargan nuevas tareas normalmente pero BOINC no sube ninguna.

Un saludo

Deuvedé -

Guiri-1: El problema no es tu configuración, sino la nuestra. Tenemos espaciados los envíos porque no estamos seguros de cuanta carga podemos aguantar (tanto en creación, envío y recepción, número y ancho de banda). A pesar del freno, los servidores pasan algunos días bastante saturados.

Manio: Si, vale, :P me refería a las de Ibercivis. Mi objetivo era saber si era algún problema de configuración del fpops_estimado de alguna de las aplicaciones. Probablemente, el origen del problema sea el mismo que para Guiri-1. Rosetta aplicará un envío más agresivo (sin tiempo entre envío y envío y todo lo que se pueda). En nuestro caso, tal vez nos podamos permitir enviar un poco más deprisa, pero de momento, se queda como está.

manio -

No se si con "todas las aplicaciones" te refieres sólo a "todas las aplicaciones ibercivis", así que te contesto en general.

No he visto diferencia entre unas aplicaciones de ibercivis y otras. Hace 20 min tenía en proceso una tarea de nanoluz, y ninguna tarea ibercivis en cola.
Otras veces he tenido una de proteínas, y cero en cola. No puedo garantizar que pase lo mismo con todas, pero creo que es así.

He suscrito uno de mis PC (el 53349) a rosetta@home. Para rosetta@home descarga "unas cuantas" tareas (ahora mismo tiene 5 tareas de 4 horas) y en cuanto termina una, baja más sin esperar a vacíar la cola.
Estos días el rosetta lo he tenido con "no bajar nuevas tareas", y sólo aprovechaba los ratos muertos entre tareas ibercivis.
Hoy le he ordenado "permitir nuevas tareas" al rosetta, para poder contarte qué hacía y me ha descargado hasta 5. A partir de ahí, en cuanto ha terminado la última tarea ibercivis, ya no ha bajado más. Tengo 0 tareas ibercivis, ni siquiera una activa, y no se quiere bajar más. Dice:

Sending scheduler request: Requested by user. Requesting 0 seconds of work, reporting 0 completed tasks
Scheduler request succeeded: got 0 new tasks

Actualización: tras cancelar una tarea rosetta (quedan 4), me ha descargado 2 tareas de ibercivis (cosa que no hacía cuando tenía sólo 2 de rosetta).

Hoy mi máquina 54105 (ibercivis sin más proyectos) sí ha mantenido alguna tarea en espera.
La máquina 53377 se enciende muy poco y sólo tiene ibercivis en el boinc. Ahora mismo se queda con una tarea activa y no pide más hasta terminar.

Si encuentro alguna pauta te lo haré saber. Probablemente puedas reproducir lo que te cuento instalando boinc+ibercivis en un pc que no lo tenga. Yo los tengo encendidos unas horas al día.

Guiri-1 -

A mi me ocurre a veces que, por ejemplo estoy desconectado de la red y proceso. Entonces temrino todas las WU y a la vuelta el cliente pide un chorro de WU's pero siempre pone "Got 1 taks"...Y claro mientras que pide de nuevo ya ha terminado esa y tengo 1 núcleo muerto risa...Y además cada vez tarda más entre petición y petición.
Es problema de algo que configurado mal? No me pasa siempre...

Deuvede -

¿Este problema te pasa con trabajos de todas las aplicaciones?

manio -

Hola:

Quiero comentar un par de posibles problemas de configuración en el sistema. Y en un post de hace tiempo deuvede dijo que este era el sitio adecuado, así que allá voy:

- Parte 1. Recién instalado:
He instalado BOINc en 4 máquinas, y acto seguido las he unido a ibercivis.
El comportamiento de todas es el mismo.
Hasta que una máquina termina el primer paquete de trabajo, descarga tareas sin parar, una cada minuto más o menos.

Lo esperado sería que llenase un buffer de trabajo suficiente para 8 horas, pero parece que supone que cada tarea le va a costar unos 30 segs y no deja de pedir cada minuto.

Requesting 29578 seconds of work
request succeeded: got 1 new tasks
Requesting 29548 seconds of work
request succeeded: got 1 new tasks
Requesting 29519 seconds of work

Al final descarga más trabajo de las 8 horas que tiene en la configuración del BOINC y del que puede hacer en plazo y se descartan tareas.
Una vez que termina el primer paquete, parece que se da cuenta de lo que cuesta, y la cantidad de segundos de "Requesting x seconds of work" varía con más sentido

Creo que se debe a que el valor inicial de "tiempo estimado para realizar una tarea" es demasiado pequeño. 30-60 minutos sería más eficiente.


Parte 2:
Después de hartarse a descargar, deja de descargar tareas y con el tiempo se vacía completamente el buffer de tareas pendientes.
Y hasta que no termina de subir la única tarea que tiene, no empieza a descargar la siguiente, de forma que entre una
y otra queda un tiempo con cero tareas de ibercivis, y las tareas de otros proyectos se os "cuelan".

Los mensajes son:
No work sent
(won't finish in time) Computer on 76.0% of time, BOINC on 99.8% of that

Deuvede -

Gracias por ofrecerte Guiri-1. De momento, el blog se mantiene en español De todas formas, si hay alguna noticia especialmente relevante, la traduciremos.

Digi421. The person in charge of nanoluz is a bit novice, and he screwed up the templates this weekend. He put a very low fpops_bound, so nearly every workunit failed this Sunday. Nanoluz application now is working fine, please try again.

For the moment, the blog will be in Spanish. If there are some relevant news we will translate then. Nevertheless, if several users post in the comments demanding an English version of the news, we will translate them all.

Guiri-1 -

Me ofrezco a traducirlas, si lo estimais de utilidad :)

Digi421. I'll try to translate any new, I've just told them that I could do so for non-spanish speaker people.
:)

[SG]Digi421 -

Sorry for posting in English - I do not speak Spanish.
The new nanoluz application seems to be buggy at times. All my nanoluz WUs ended with a "computation error" so for now I have disabled nanoluz in my preferences.
And one general remark: Since distributed computing is usually international, do you think you could perhaps post news in english as well? I know a whole lot of people who do not speak spanish and hence have no idea what is happening here.

JK -

Tengo 3 de nanoluz pendientes por subir y no se envian. Tampoco me descarga ninguna nueva(nanoluz, neurosim, fusion ni proteinas)

markj -

parece que estais "back in business", felicidades.
Aunque los Materiales48 me siguen dando errores de cálculo, y me he desvinculado de este parte del proyecto.

Deuvedé -

No, estamos de apagón. Aun tardará un buen rato.

Antonio -

¿Estan ya en marcha los servidores?

Tengo como unas 20wu pendientes de subir y no se descarga ninguna nueva.

Guiri-1 -

What a putada¡
Bueno,así los servidorres se descargan de trabajo acumulado y nos preparais muchas WU's ...:)