10.000 simulaciones por partido y ninguna capta el jet lag de un vuelo Seattle-Miami
Los computer picks — predicciones generadas por modelos algorítmicos — se han convertido en una herramienta ubicua para el apostador de fútbol. Plataformas como Dimers, Forebet, FiveThirtyEight (cuando cubría deportes) y decenas de cuentas en redes sociales ofrecen pronósticos automatizados para cada partido de la MLS. Algunos ejecutan miles de simulaciones Monte Carlo por encuentro. Otros usan redes neuronales entrenadas con décadas de datos históricos. Todos prometen un edge sobre el apostador manual.
La realidad es más matizada. Los modelos algorítmicos son herramientas poderosas para procesar grandes volúmenes de datos y detectar patrones que el ojo humano no ve. Pero tienen puntos ciegos estructurales — variables que no pueden cuantificar, contextos que no capturan, información que no reciben hasta que es demasiado tarde. En la MLS, esos puntos ciegos son más amplios que en las ligas europeas, porque la liga tiene más variables no estándar: viajes extremos, altitud, salary cap, Designated Players con impacto desproporcionado.
Este artículo explica cómo funcionan los modelos, qué captan y qué ignoran, y cómo el apostador puede usarlos como input sin convertirlos en decisión final. Los algoritmos informan — tú decides.
contents ↑Cómo funcionan: inputs, simulaciones y outputs
La mayoría de los modelos algorítmicos para la MLS operan con una estructura común. Reciben inputs — datos históricos de resultados, xG por equipo y por partido, forma reciente, cuotas de mercado, posición en la tabla, rendimiento local vs visitante. Procesan esos inputs a través de un modelo estadístico — regresión logística, simulación Monte Carlo, red neuronal o una combinación. Y producen outputs: probabilidad estimada de victoria de cada equipo, número de goles esperados y, en los más sofisticados, cuotas sugeridas que se comparan con las del mercado para identificar valor.
Un modelo como el de Dimers ejecuta 10.000 simulaciones por partido: genera 10.000 escenarios posibles basándose en las distribuciones de probabilidad de cada variable de input y cuenta cuántas veces gana cada equipo, cuántas veces se produce Over 2.5, cuántas veces se da BTTS. Si el local gana en 5.200 de las 10.000 simulaciones, la probabilidad estimada es del 52%. LAFC, con su xGD de +16,5 en 2024, según GiveMeSport, aparece como favorito en la mayoría de las simulaciones cuando juega en casa — un output coherente con los datos subyacentes.
Forebet utiliza un enfoque distinto: un algoritmo de machine learning entrenado con datos desde 2009 que pondera el rendimiento reciente, el head-to-head y las cuotas del mercado como proxy de probabilidad. Su output es una predicción de marcador con una probabilidad asociada. La ventaja de Forebet es su consistencia a largo plazo y la amplitud de ligas cubiertas. Su limitación es que, al ponderar fuertemente el head-to-head y la forma reciente, hereda los sesgos de esas variables — que en la MLS, como hemos visto, son menos fiables que en Europa.
Otros modelos menos conocidos pero relevantes incluyen los basados en ratings Elo — un sistema de puntuación adaptado del ajedrez que asigna una fuerza relativa a cada equipo y la actualiza tras cada partido. Los ratings Elo son sencillos, transparentes y sorprendentemente efectivos como línea base. Su debilidad en la MLS es que tratan todos los partidos con el mismo peso: una victoria en la primera jornada contra un rival que aún no ha encontrado su forma computa igual que una victoria en la jornada 30 contra un rival motivado. Para una liga con tanta variación estacional como la MLS, esa falta de ponderación temporal es un punto ciego relevante.
contents ↑Fortalezas y límites: qué captan y qué ignoran los modelos
Los modelos son excelentes para captar tendencias estadísticas a nivel de equipo: xG sostenido, rendimiento local vs visitante, eficiencia goleadora, distribución de goles por franja de minutos. Procesan esos datos más rápido y con menos sesgo emocional que cualquier apostador humano. Si un equipo tiene un xGD de +10 en las últimas quince jornadas, el modelo lo refleja sin dejarse influir por la percepción mediática del equipo ni por el resultado de su último partido.
Pero los modelos ignoran variables que en la MLS son determinantes. La primera es el travel fatigue en su dimensión concreta: un vuelo Seattle-Miami de seis horas con cambio de tres husos horarios reduce el rendimiento del visitante hasta un 15%, según NerdyTips, pero ningún modelo público incorpora la distancia específica del viaje previo al partido como variable de input. Los modelos captan el rendimiento visitante como categoría general, no el viaje concreto de ese partido concreto.
La segunda variable ignorada es la disponibilidad de DPs. Los modelos usan datos de equipo, no de jugador individual. Si Messi no juega un partido de Inter Miami, el modelo sigue usando el xG del equipo con Messi como base. La caída real de rendimiento sin un DP clave es mayor que la que cualquier modelo de equipo captura, porque la dependencia es estructural, no marginal.
La tercera es la motivación diferencial. En la MLS, un equipo eliminado que recibe a un candidato a playoffs juega con una intensidad radicalmente distinta. Los modelos no distinguen entre un partido con implicaciones de clasificación y un dead rubber — asignan la misma calidad de equipo a ambos escenarios. El apostador humano que lee el contexto competitivo tiene una ventaja que el algoritmo no puede replicar.
Hay una cuarta limitación menos obvia: la latencia de datos. Los modelos se actualizan con los resultados y estadísticas de los partidos ya jugados, pero no con la información que surge entre jornadas — fichajes confirmados a mitad de semana, lesiones en entrenamiento, cambios tácticos anunciados en ruedas de prensa. En la MLS, donde la ventana de fichajes de verano permite incorporaciones durante la temporada, un modelo que no ha procesado el fichaje de un DP ofensivo anunciado el martes producirá probabilidades desactualizadas para el partido del sábado. El apostador que sigue las noticias de la liga en tiempo real tiene un edge temporal sobre el modelo.
contents ↑Cómo usar computer picks como input — no como decisión final
La forma más rentable de usar computer picks es como punto de partida para el análisis propio, no como sustituto. El modelo te da una probabilidad base: según los datos históricos, el local tiene un 55% de probabilidad de ganar. Tu trabajo es ajustar esa probabilidad incorporando las variables que el modelo ignora: viaje del visitante, disponibilidad de DPs, motivación, condiciones meteorológicas.
Si después de tu ajuste la probabilidad sube al 60% y la cuota de mercado implica un 50%, hay valor. Si después de tu ajuste la probabilidad baja al 48% y la cuota implica un 50%, no hay valor y debes pasar el partido. El computer pick nunca debería ser la razón final por la que apuestas — debería ser el punto de referencia contra el que mides tu propio análisis.
Un workflow práctico: cada jornada, consultar las probabilidades de Dimers o Forebet para los partidos seleccionados. Compararlas con las cuotas de mercado. Identificar discrepancias. Luego, antes de apostar, verificar manualmente las tres variables que los modelos ignoran: viaje, DPs disponibles y contexto competitivo. Si la discrepancia sobrevive a esa verificación, apostar. Si no, descartar. Este proceso añade quince minutos de trabajo por partido, pero esos quince minutos son los que separan al apostador que usa modelos del apostador que depende de ellos.
Los modelos algorítmicos han mejorado dramáticamente en la última década. Pero en una liga como la MLS — con más variables no estándar que cualquier liga europea — el apostador que combina datos de modelo con juicio contextual tiene una ventaja sobre el que sigue al algoritmo ciegamente. Los algoritmos informan. Tú decides. Y esa decisión es donde se encuentra el edge real.
