Informe de calibración del modelo

En 1012 partidos de Mundial, las probabilidades del resultado principal están razonablemente calibradas: Brier 0.5704, ECE 3.6%. La misma prueba walk-forward da una tasa de acierto V/E/D de 56.9%. Son probabilidades, no garantías.

1012
Partidos de Mundial
23
Torneos
56.9%
Acierto del pick principal
0.5704
Puntuación Brier
3.6%
error esperado de calibración
2026-06-25
fecha del informe

Definición citable: la calibración comprueba si las probabilidades predichas coinciden con resultados observados en muchos partidos. Un pronóstico bien calibrado del 60% debería ganar cerca del 60% de las veces en una muestra suficiente.

Qué significa

El modelo está mejor calibrado en el rango de 40-80% de confianza, donde las probabilidades suelen seguir de cerca los resultados reales del Mundial. Los buckets de confianza muy alta tienen menos partidos históricos, así que requieren más cautela. En claro: un pick del 60-70% se comportó históricamente como favorito fuerte pero batible, no como ganador garantizado.

Fiabilidad por bucket de confianza

Cada fila agrupa partidos por la probabilidad más alta del modelo antes del inicio. Por ejemplo, el bucket 60-70% pregunta: cuando el pick principal estaba cerca de dos tercios de probabilidad, ¿con qué frecuencia ocurrió?

Confianza del modelo Partidos Media modelo Acierto real Diferencia
0-10% 0
10-20% 0
20-30% 0
30-40% 99 38.6% 36.4% -2.2%
40-50% 287 45.0% 49.5% +4.5%
50-60% 259 54.8% 55.2% +0.4%
60-70% 182 64.9% 68.1% +3.3%
70-80% 119 74.4% 71.4% -2.9%
80-90% 52 84.5% 71.2% -13.4%
90-100% 14 93.0% 64.3% -28.7%

Diagrama de fiabilidad

0-10%
Modelo — Real —
10-20%
Modelo — Real —
20-30%
Modelo — Real —
30-40%
Modelo 38.6% Real 36.4%
40-50%
Modelo 45.0% Real 49.5%
50-60%
Modelo 54.8% Real 55.2%
60-70%
Modelo 64.9% Real 68.1%
70-80%
Modelo 74.4% Real 71.4%
80-90%
Modelo 84.5% Real 71.2%
90-100%
Modelo 93.0% Real 64.3%

Los buckets con pocos partidos son ruidosos. En este informe, el bucket 90-100% tiene solo 14 partidos, por lo que su diferencia no debe sobreinterpretarse.

Método

Reproducimos cada partido internacional del dataset (49,453 juegos) en orden cronológico. Antes de cada partido histórico de Mundial, el modelo predice usando solo los ratings Elo disponibles en ese momento; luego el resultado real actualiza los ratings. No se usa información futura.

El modelo probabilístico usa Elo + Poisson con eloToGoals=0.0022, goles base 1.35 y ventaja local de 100 puntos solo para partidos no neutrales. El informe cubre los 23 Mundiales de 1930 a 2026.

Los datos de partidos vienen del dataset abierto martj42/international_results (cada partido internacional desde 1872); partidos del Mundial 2026 de TheSportsDB.

Preguntas frecuentes

¿Qué significa calibración del modelo?

La calibración comprueba si las probabilidades predichas coinciden con resultados reales. Si un modelo da a muchos equipos un 60%, esos pronósticos deberían ganar cerca del 60% en una muestra suficiente.

¿Cuántos partidos incluye?

Este informe usa 1012 partidos de fases finales del Mundial en 23 torneos de 1930 a 2026, con prueba walk-forward sin datos futuros.

¿Cómo leo los buckets de confianza?

Cada bucket compara lo que el modelo dijo antes del inicio con lo que ocurrió. El modelo está mejor calibrado entre 40-80%, mientras los buckets de confianza muy alta tienen menos partidos y requieren más cautela.

¿Las probabilidades calibradas garantizan resultados?

No. La calibración es una prueba histórica de fiabilidad, no una garantía. El fútbol sigue siendo incierto y los buckets pequeños pueden ser ruidosos.

Actualizado 2026-06-25.