Informe de calibración del modelo
En 1012 partidos de Mundial, las probabilidades del resultado principal están razonablemente calibradas: Brier 0.5704, ECE 3.6%. La misma prueba walk-forward da una tasa de acierto V/E/D de 56.9%. Son probabilidades, no garantías.
Partidos de Mundial
Torneos
Acierto del pick principal
Puntuación Brier
error esperado de calibración
fecha del informe
Definición citable: la calibración comprueba si las probabilidades predichas coinciden con resultados observados en muchos partidos. Un pronóstico bien calibrado del 60% debería ganar cerca del 60% de las veces en una muestra suficiente.
Qué significa
El modelo está mejor calibrado en el rango de 40-80% de confianza, donde las probabilidades suelen seguir de cerca los resultados reales del Mundial. Los buckets de confianza muy alta tienen menos partidos históricos, así que requieren más cautela. En claro: un pick del 60-70% se comportó históricamente como favorito fuerte pero batible, no como ganador garantizado.
Fiabilidad por bucket de confianza
Cada fila agrupa partidos por la probabilidad más alta del modelo antes del inicio. Por ejemplo, el bucket 60-70% pregunta: cuando el pick principal estaba cerca de dos tercios de probabilidad, ¿con qué frecuencia ocurrió?
| Confianza del modelo | Partidos | Media modelo | Acierto real | Diferencia |
|---|---|---|---|---|
| 0-10% | 0 | — | — | — |
| 10-20% | 0 | — | — | — |
| 20-30% | 0 | — | — | — |
| 30-40% | 99 | 38.6% | 36.4% | -2.2% |
| 40-50% | 287 | 45.0% | 49.5% | +4.5% |
| 50-60% | 259 | 54.8% | 55.2% | +0.4% |
| 60-70% | 182 | 64.9% | 68.1% | +3.3% |
| 70-80% | 119 | 74.4% | 71.4% | -2.9% |
| 80-90% | 52 | 84.5% | 71.2% | -13.4% |
| 90-100% | 14 | 93.0% | 64.3% | -28.7% |
Diagrama de fiabilidad
Los buckets con pocos partidos son ruidosos. En este informe, el bucket 90-100% tiene solo 14 partidos, por lo que su diferencia no debe sobreinterpretarse.
Método
Reproducimos cada partido internacional del dataset (49,453 juegos) en orden cronológico. Antes de cada partido histórico de Mundial, el modelo predice usando solo los ratings Elo disponibles en ese momento; luego el resultado real actualiza los ratings. No se usa información futura.
El modelo probabilístico usa Elo + Poisson con eloToGoals=0.0022, goles base 1.35 y ventaja local de 100 puntos solo para partidos no neutrales. El informe cubre los 23 Mundiales de 1930 a 2026.
Los datos de partidos vienen del dataset abierto martj42/international_results (cada partido internacional desde 1872); partidos del Mundial 2026 de TheSportsDB.
Preguntas frecuentes
¿Qué significa calibración del modelo?
La calibración comprueba si las probabilidades predichas coinciden con resultados reales. Si un modelo da a muchos equipos un 60%, esos pronósticos deberían ganar cerca del 60% en una muestra suficiente.
¿Cuántos partidos incluye?
Este informe usa 1012 partidos de fases finales del Mundial en 23 torneos de 1930 a 2026, con prueba walk-forward sin datos futuros.
¿Cómo leo los buckets de confianza?
Cada bucket compara lo que el modelo dijo antes del inicio con lo que ocurrió. El modelo está mejor calibrado entre 40-80%, mientras los buckets de confianza muy alta tienen menos partidos y requieren más cautela.
¿Las probabilidades calibradas garantizan resultados?
No. La calibración es una prueba histórica de fiabilidad, no una garantía. El fútbol sigue siendo incierto y los buckets pequeños pueden ser ruidosos.
Actualizado 2026-06-25.