Blogia
Blog de Ibercivis

A vueltas con los créditos

A vueltas con los créditos

(la gráfica muestra en horizontal los Gflops y en vertical los Giops de las máquinas activas ayer en Ibercivis. La línea que cruza es el promedio de ambos; todas las máquinas en esa línea o en alguna paralela obtienen igual puntuación a igual tiempo de CPU)

En Zivis ya notamos que la gente tiende a quejarse de los pocos creditos obtenidos en nuestros proyectos.  Esta vez, hemos echado un vistazo a las estadísticas que da boinstats para acabar constatando, sorprendidos, que no es tal el caso: Rosetta y WCG dan menos créditos que nosotros, y sólo SIMAP y Einstein@home, de entre los mas populares, dan claramente más créditos.

¿Qué pasa entonces? La conjetura es que la queja puede provenir de las máquinas menos potentes: la mayoría de estos proyectos (excepto Rosetta) exigen tres resultados de quorum y suelen mandar más, digamos cuatro o cinco. En tal caso, los créditos concedidos son el promedio de los intermedios, así que la máquina que ha hecho la petición mas baja recibe al final más créditos de los que ha pedido. Estos cálculos los podéis ver explicados aquí http://www.boinc-wiki.info/Credit#Credit_Granting_Rules.

Si miramos la distribución de Gigaflops y Gigaiops de las máquinas activas en Ibercivis, veréis que aunque el promedio es de 4.9 hay una dispersión muy amplia; en la grafica hay 1018 maquinas bajo la línea promedio y 762 por encima. En otros proyectos, los que están por debajo tienen una cierta probabilidad de ser agrupados con los de la parte de arriba y obtener por ello más (?) creditos. En el nuestro, de momento los investigadores están optando por correr sin redundancia (y hacer uso de análisis y postvalidación al recibir), así que el quorum mínimo es de un solo resultado y este beneficio no se produce: obtienen mas crédito las máquinas más potentes a igualdad de tiempo de cálculo. Os recuerdo que la fórmula básica de cálculo dice que el crédito es proporcional a la suma (flops+iops) y al tiempo de cálculo empleado, ya que se supone que un crédito es la producción de un hipotético pentium básico durante un día de cálculo.

¿Qué opináis? ¿Es esto lo que esta ocurriendo, o hay otras causas involucradas? Ahora que lo pienso, he simplificado demasiado porque la discusión anterior no considera que el que tiene menos potencia ha tardado más. ¿Quién está pidiendo más crédito, y quién menos, para una workunit dada... los que tienen más, o los que tienen menos potencia? Precisamente, al no tener casi redundancia, no tenemos ese dato directamente en ibercivis.

 

9 comentarios

Deuvede -

El cálculo de la media es bastante complejo. Entre otros factores, hay que tener en cuenta que la media de créditos se refiere a la media de créditos reciente. Es decir, que si tú, por alguna razón, no devuelves trabajos, el servidor va bajando tu media. También te comento que diferentes aplicaciones tienen diferente número de operaciones, lo que da lugar a diferente cantidad de créditos por unidad de trabajo y tiempo. Esto puede explicar el porqué tu máquina acaba con menos media tras estar 24 horas sin parar.

Merece la pena buscar el código fuente, para ver cómo se calcula la media exactamente.

Anthony -

No entiendo muy bien como funciona lo de los creditos pero si he observado en más de una ocasión que si no tengo trabajo por que el servidor no me lo da me baja el promedio mucho más que cuando esta trabajando.
Otras veces queda el ordenador trabajando se desconecta de la linea telefonica y tambien baja la media escesivamente, a pesar de seguir treabajando y luego informar posteriormente de los trabajos relizados.
No entiendo como estando trabajando normalmente el ordenador haya dias que terminas con menos media que cuando empezaste el dia.

Deuvede -

Normalmente, los trabajos tienen una caducidad de dos días. La excepción proviene de materiales, cuyo investigador pidió expresamente que su caducidad se redujera a un día. No obstante, si varias personas postean pidiendo un aumento de la caducidad se puede considerar el aumento de la caducidad de docking y fusión.

Manuel Manchon -

Caducidad de los paquetes.

Aún no sé si esta cuestión se está teniendo en cuenta o no pero la planteo aquí y ahora.

No es inusual el que tengamos pcs con paquetes descargados el viernes y que están inactivos sábados y domingos....vuelves el lunes y los paquetes han caducado.

¿Existe la posibilidad de que caduquen, al menos, 24 horas más tarde de lo normal?.
Salud

Alejandro Rivero -

Bueno, a mi lo que me tiene preocupado es el asunto de que tecnicamente estemos dando menos. Lo que aconsejais es que desde el pto de vista de marketing conveniente dar mas, o hacer rondas de dar mas.

Voy a hacer otro analisis de creditos en funcion de la potencia, a ver si seria conveniente dar ese minimo independiente de la cpu y/o si ocurre mucho perjuicio respecto a los proyectos con quorum alto. En todo caso, en esos proyectos hay siempre un beneficiado, un perjudicado y uno que se queda como esta, pero claro, siempre son los mismos los que estan en cada lado (y lo dicho, aun no tengo claro si son los de mas o los de menor potencia los que se quedan en el lado perjudicado).

galle -

poner unos créditos mínimos por unidad de trabajo suena interesante, al menos para los que tardamos 50 minutos en hacer una wu de fusion y sacamos 4 cerditos ¬¬U...

comparando, tardo 5 horas en calcular una wu de einstein, y me dan 237 créditos... no hay comparación!!!!!

Manuel Manchon -

Estoy totalmente de acuerdo con lo manifestado por Rafa.
Aún diría más: para constatar la "pérdida" de puntos por parte del equipo tan sólo hay que tomar como referencia el mes de mayo y compararlo con los datos desde la puesta en marcha, oficialmente, de ibercivis.
Salud

Rafa Hens (El Califa) -

Precisamente es tan sencillo como mirar esa misma tabla que ponéis de ejemplo.

A parte de debates técnicos, la percepción general del usuario es esa disminución en los créditos recibidos respecto a otros proyectos.

Si ordenamos esa tabla según el coeficiente de créditos de ibercivis respecto al resto de proyectos, donde se toma como unidad vuestro proyecto, resultaría que Ibercivis obsequia con más créditos que el 34% de los proyectos reflejados en esa tabla, pero por el mismo motivo, obsequia con menos créditos que el 66%!! de los proyectos.

Según esa misma tabla, parece cierto que Ibercivis da un 16% mas de crédito que WCG y un 26% mas que Rosetta, pero resulta que los otros proyectos que citas de ejemplo aparece que SIMAP dá un 30% mas que ibercivis y Einstein un 62%!!! mas...

Otros proyectos populares:

QMC: un 50% mas
PrimeGrid: un 25% mas
RieselSieve: un 68% mas
Cosmology: un 73% mas


La idea general no es que esto se convierta como en PS3Grid, que con solo 180 host activos realizan medio millón de créditos diarios, pero tampoco es la idea perder la parte "divertida" del usuario, que es ver su progresión en las estadísticas.

Sirva de ejemplo que, el equipo en el que participo, desde que nos dedicamos a ibercivis, generamos unos 50.000 créditos menos cada día...

Ivan Rodriguez Delgado -

Yo lo único que te puedo decir fijo, es que no quiero menos puntos. Pero tampoco quiero, que deis puntos por dar a granel, por que luego no seria algo real. Si realmente el problema radica en lo que has comentado, cuando pongáis mas adelante que sea necesario mas quórum el problema se solucionaría automáticamente. Pero si por lo contrario, no tenéis intención de ponerlo hasta dentro de mucho tiempo, pues tocaría añadir mas puntos a las unidades, o por lo menos que siempre se obtuviera un mínimo de puntos, de esa forma las maquinas potentes no estarían dopadas y las pequeñas, seguirían haciendo lo que buenamente pudieran, que bastante tienen con llegar a la hora acordada con los deberes hechos.