junio 26, 2014

Qué tan buenas son mis predicciones... ¿será que me gano “la polla”?


Imaginemos que alguien quiere hacer una predicción de los resultados de los partidos correspondientes a la primera fase del mundial. Se trata, en total, de 48 partidos –ocho grupos de cuatro equipos con seis partidos por grupo—que pueden terminar en: gana el equipo A, empatan A y B o gana el equipo B. En este caso sólo consideraremos resultados y no vamos a tener en cuenta los marcadores.

Las distintas formas en que podría llenarse el formulario, 48 resultados con tres posibilidades, son del orden de 8 x 10^(22), un ocho seguido de 22 ceros: es decir, si quisieramos abarcar todas las posibilidades de resultados, como en el baloto, deberíamos comprar la enorme cantidad de ochenta mil trillones de formularios.

Para que nos demos cuenta de la magnitud del asunto, si ocupáramos sólo un segundo en diligenciar cada formulario, requeriríamos de 2500 billones de años para llenar todos los formularios; un poco más de las pocas semanas que ocupan esta primera fase del mundial. De hecho, ¡la tierra sólo tiene unos cuatro mil quinientos millones de años y el universo no llega a los quince mil millones! ¡Ni qué decir de la cantidad de papel y de tinta que necesitaríamos para diligenciar la totalidad de los formularios!

Pero éste no es el asunto que quería tratar. Hice mis predicciones para la primera fase y acerté el resultado en un total de 26 partidos de los 48. La pregunta que me hago es qué tan bueno resultó mi modelo, si me aportó alguna ventaja frente a los demás.

Miremos esto. Si asumimos que los resultados son equiprobables, situación bastante dudosa (ya explicaré por qué) la probabilidad de acertar los 48 resultados de la primera fase es una oportunidad de 7.9 x 10^(22) posibles, es decir, es prácticamente nula; mientras que la probabilidad de no acertar ningún resultado es una en 280 millones aproximadamente; una cantidad mucho más grande que la primera –del orden de 10^(14)-- así no lo parezca.

Sin embargo, la media de aciertos está en unos 16 resultados de 48 con un 12% de probabilidad; quiere decir esto que aproximadamente un 12% de formularios llenados al azar tendrán un acierto de 16 resultados de 48 (ver gráfico).





En este caso, los aciertos fueron 26 que parece ser un buen resultado. Sin embargo, entra aquí otro concepto que es la dispersión de la función. Si todos los resultados se acumularan en torno a la media –16 aciertos— la apuesta no tendría mucho atractivo ya que la mayoría tendería a obtener resultados similares. Notemos, más bien, que un poco más del 90% de los aciertos se produce entre 10 y 22 aciertos (el número medio de aciertos más o menos seis aciertos). En este sentido, 26 aciertos representan una ventaja significativa. La probabilidad de que alguien tenga más de 26 aciertos es de 1 en 1100 aproximadamente que es bastante baja. Pero no debemos olvidar que el cálculo partió de resultados equiprobables que, para el caso del fútbol, no aplican mucho puesto que hay equipos mucho más fuertes que otros y cuyo triunfo es más previsible desde el modelo de “fuerza competitiva” utilizado. Pero también habría que considerar el hecho de que los empates, por ejemplo, representan sólo el 22% de los resultados en un mundial (fuente FIFA) y no el 33% como los asume el modelo.


Como dato curioso, para la primera fase sólo se produjo empate en el 19% de los partidos, en el 81% restante ganó el equipo A o el equipo B; el número de goles promedio por partido fué de 2.8 y el triunfo por diferencia de un gol se produjo el 44% de las veces. Así que si no tiene idea del fútbol y le piden un marcador para esta segunda fase del mundial, ¡escoja el equipo que más le parezca y proponga que gana 2-1 (el promedio de esta primera fase) o 1-0 (el marcador más común en todos los mundiales con un 18.8% de casos)! Es todo.

¡Felices octavos de final!


-Molibdenus.

No hay comentarios.: