A vueltas con los créditos

(la gráfica muestra en horizontal los Gflops y en vertical los Giops de las máquinas activas ayer en Ibercivis. La línea que cruza es el promedio de ambos; todas las máquinas en esa línea o en alguna paralela obtienen igual puntuación a igual tiempo de CPU)
En Zivis ya notamos que la gente tiende a quejarse de los pocos creditos obtenidos en nuestros proyectos. Esta vez, hemos echado un vistazo a las estadísticas que da boinstats para acabar constatando, sorprendidos, que no es tal el caso: Rosetta y WCG dan menos créditos que nosotros, y sólo SIMAP y Einstein@home, de entre los mas populares, dan claramente más créditos.
¿Qué pasa entonces? La conjetura es que la queja puede provenir de las máquinas menos potentes: la mayoría de estos proyectos (excepto Rosetta) exigen tres resultados de quorum y suelen mandar más, digamos cuatro o cinco. En tal caso, los créditos concedidos son el promedio de los intermedios, así que la máquina que ha hecho la petición mas baja recibe al final más créditos de los que ha pedido. Estos cálculos los podéis ver explicados aquí http://www.boinc-wiki.info/Credit#Credit_Granting_Rules.
Si miramos la distribución de Gigaflops y Gigaiops de las máquinas activas en Ibercivis, veréis que aunque el promedio es de 4.9 hay una dispersión muy amplia; en la grafica hay 1018 maquinas bajo la línea promedio y 762 por encima. En otros proyectos, los que están por debajo tienen una cierta probabilidad de ser agrupados con los de la parte de arriba y obtener por ello más (?) creditos. En el nuestro, de momento los investigadores están optando por correr sin redundancia (y hacer uso de análisis y postvalidación al recibir), así que el quorum mínimo es de un solo resultado y este beneficio no se produce: obtienen mas crédito las máquinas más potentes a igualdad de tiempo de cálculo. Os recuerdo que la fórmula básica de cálculo dice que el crédito es proporcional a la suma (flops+iops) y al tiempo de cálculo empleado, ya que se supone que un crédito es la producción de un hipotético pentium básico durante un día de cálculo.
¿Qué opináis? ¿Es esto lo que esta ocurriendo, o hay otras causas involucradas? Ahora que lo pienso, he simplificado demasiado porque la discusión anterior no considera que el que tiene menos potencia ha tardado más. ¿Quién está pidiendo más crédito, y quién menos, para una workunit dada... los que tienen más, o los que tienen menos potencia? Precisamente, al no tener casi redundancia, no tenemos ese dato directamente en ibercivis.
9 comentarios
Deuvede -
Merece la pena buscar el código fuente, para ver cómo se calcula la media exactamente.
Anthony -
Otras veces queda el ordenador trabajando se desconecta de la linea telefonica y tambien baja la media escesivamente, a pesar de seguir treabajando y luego informar posteriormente de los trabajos relizados.
No entiendo como estando trabajando normalmente el ordenador haya dias que terminas con menos media que cuando empezaste el dia.
Deuvede -
Manuel Manchon -
Aún no sé si esta cuestión se está teniendo en cuenta o no pero la planteo aquí y ahora.
No es inusual el que tengamos pcs con paquetes descargados el viernes y que están inactivos sábados y domingos....vuelves el lunes y los paquetes han caducado.
¿Existe la posibilidad de que caduquen, al menos, 24 horas más tarde de lo normal?.
Salud
Alejandro Rivero -
Voy a hacer otro analisis de creditos en funcion de la potencia, a ver si seria conveniente dar ese minimo independiente de la cpu y/o si ocurre mucho perjuicio respecto a los proyectos con quorum alto. En todo caso, en esos proyectos hay siempre un beneficiado, un perjudicado y uno que se queda como esta, pero claro, siempre son los mismos los que estan en cada lado (y lo dicho, aun no tengo claro si son los de mas o los de menor potencia los que se quedan en el lado perjudicado).
galle -
comparando, tardo 5 horas en calcular una wu de einstein, y me dan 237 créditos... no hay comparación!!!!!
Manuel Manchon -
Aún diría más: para constatar la "pérdida" de puntos por parte del equipo tan sólo hay que tomar como referencia el mes de mayo y compararlo con los datos desde la puesta en marcha, oficialmente, de ibercivis.
Salud
Rafa Hens (El Califa) -
A parte de debates técnicos, la percepción general del usuario es esa disminución en los créditos recibidos respecto a otros proyectos.
Si ordenamos esa tabla según el coeficiente de créditos de ibercivis respecto al resto de proyectos, donde se toma como unidad vuestro proyecto, resultaría que Ibercivis obsequia con más créditos que el 34% de los proyectos reflejados en esa tabla, pero por el mismo motivo, obsequia con menos créditos que el 66%!! de los proyectos.
Según esa misma tabla, parece cierto que Ibercivis da un 16% mas de crédito que WCG y un 26% mas que Rosetta, pero resulta que los otros proyectos que citas de ejemplo aparece que SIMAP dá un 30% mas que ibercivis y Einstein un 62%!!! mas...
Otros proyectos populares:
QMC: un 50% mas
PrimeGrid: un 25% mas
RieselSieve: un 68% mas
Cosmology: un 73% mas
La idea general no es que esto se convierta como en PS3Grid, que con solo 180 host activos realizan medio millón de créditos diarios, pero tampoco es la idea perder la parte "divertida" del usuario, que es ver su progresión en las estadísticas.
Sirva de ejemplo que, el equipo en el que participo, desde que nos dedicamos a ibercivis, generamos unos 50.000 créditos menos cada día...
Ivan Rodriguez Delgado -