Protocolo walk-forward estricto, split exploración/validación y pre-registro de hipótesis para eliminar el p-hacking. Cada resultado tiene que sobrevivir datos que el modelo nunca vio.
22 ligas europeas, 7 temporadas (2019-20 a 2025-26), 52803 partidos jugados descargados diariamente desde football-data.co.uk. Investigamos mercados over/under 2.5 y BTTS con integridad temporal estricta: las features de cada partido solo incluyen datos anteriores a su fecha de disputa.
Las features de cada partido usan únicamente datos anteriores a su fecha. No hay leakage temporal. Validamos el modelo "como si" lo aplicáramos en el momento real, no en retrospectiva.
Separamos las temporadas en dos bloques: 2019-20 a 2024-25 para explorar hipótesis, 2025-26 congelada para validar. La DB rechaza queries que mezclen ambos sets.
Cada estudio define su hipótesis, métrica de éxito y null hypothesis ANTES de ver resultados. Los parámetros se hashean para reproducibilidad. Esto bloquea el p-hacking estructuralmente.
Cuando un estudio completa sus runs, la IA lee la hipótesis y las métricas y devuelve un veredicto estructurado: confirmada, rechazada o inconclusa, con patrones por las variables a investigar.
Línea directa sin intermediarios — sin redes sociales, sin newsletters. Si tienes preguntas sobre la metodología, los datos o quieres colaborar, escribe aquí.