El correo electrónico llegó a la bandeja de entrada de Cláudio Silva la noche del 6 de diciembre de 2011. Una de las primeras cosas que notó fueron las tres letras en la línea de asunto: MLB.
¿Béisbol?
Silva era un profesor de la NYU especializado en ciencia de datos y gráficos por computadora. Una vez trabajó en AT&T Labs e IBM Research. Esas eran siglas que entendía. Pero MLB, Silva creció en Fortaleza, Brasil, una ciudad costera donde el béisbol tenía poca relevancia. Cuando obtuvo su doctorado en la Universidad Estatal de Nueva York en Stony Brook, nunca se molestó en aprender las reglas.
El correo electrónico fue escrito por Dirk Van Dall, quien trabajaba con Major League Baseball Advanced Media (MLBAM), el brazo digital de la liga. Fue enviado a Silva por Yann LeCun, otro profesor de la NYU y uno de los principales expertos mundiales en aprendizaje automático. Silva leyó las primeras líneas. Hablaba de un proyecto secreto en marcha. “MLBAM está trabajando con un proveedor en tecnología para identificar y rastrear la posición y trayectoria de los 18 jugadores en el campo”, escribió Van Dall. El problema, continuó, era que el torrente de datos resultante necesitaría ser comprimido, codificado y organizado sobre la marcha para su uso por parte de locutores, analistas y entrenadores.
Van Dall no mencionó que el proyecto podría revolucionar el deporte, transformando la forma en que los equipos evalúan a los jugadores o cómo los aficionados ven los juegos. Tampoco mencionó el nombre eventual del proyecto: Statcast.
Silva no estaba convencido. Compartiendo el correo electrónico con Carlos Dietrich, otro experto brasileño en gráficos, Silva dijo: “Parece interesante. Pero no tiene valor académico”.
Aun así, Major League Baseball no era una marca para despreciar. Además, en comparación con otros proyectos corporativos, este parecía inusualmente relajado. Cuando Silva y Dietrich acordaron consultar, la liga no les dio acuerdos de confidencialidad ni lenguaje legal, solo un CD que contenía datos de seguimiento de jugadores de un juego de ese año: 2 de agosto de 2011: Kansas City Royals 8, Baltimore Orioles 2. Ese, diría Dietrich, fue el día en que “Statcast realmente comenzó”.
Ese conjunto de datos dio lugar a años de investigación, pruebas e innovación tecnológica. Dos brasileños que apenas entendían el béisbol crearon un motor de datos, apodado “caja negra”, porque nadie más sabía cómo funcionaba, en base al cual se construirían los cimientos estructurales de Statcast, el sistema de seguimiento que impulsó otra ola de la revolución sabermétrica.
Han pasado 10 años desde que una versión primitiva de Statcast debutó en el Derby de Jonrones de 2014. La “era Statcast” ha sido un periodo de profundos cambios. Se han desarrollado y popularizado nuevas estadísticas como resultado, y el vocabulario moderno del béisbol se ha expandido, con frases como velocidad de salida y ángulo de lanzamiento entrando en el lenguaje común. El torrente de datos ha inflado los departamentos de análisis, transformado la búsqueda de talentos y el desarrollo de jugadores, y ha perforado creencias arraigadas. (¿Pensaste que sabías cómo se producía el poder? Piénsalo de nuevo). Statcast está en todas partes, producido y promocionado por la liga, pero al alcance de no todos. Embelesa a los aficionados con inclinaciones analíticas e irrita a otros.
Miles de puntos de datos se han destilado en ideas que han hecho del béisbol un juego más inteligente. ¿Pero uno mejor? Eso está en debate.
“Parece que algo de la vieja escuela se ha perdido”, dijo el lanzador de los Cachorros, Drew Smyly.
“El juego de la vieja escuela es cosa del pasado”, contrarrestó el bateador designado de los Mets, J.D. Martinez. “No podemos jugar este juego así más”.
Diez años antes del correo electrónico, un sábado por la noche en Oakland, Derek Jeter se desplazó por el diamante para atrapar un lanzamiento errante y lanzarle la pelota al receptor Jorge Posada a tiempo para etiquetar a Jeremy Giambi y preservar la ventaja de los New York Yankees en el Juego 3 de la Serie Divisional de la Liga Americana. En las oficinas de la MLB en Park Avenue al día siguiente, se debatía. ¿Qué pasaría si Paul O’Neill hubiera estado en el jardín derecho en lugar de Shane Spencer? ¿Qué pasaría si el tiro de Spencer hubiera golpeado a alguno de los cortadores? ¿Qué pasaría si el manager de los Atléticos, Art Howe, hubiera corrido a Eric Byrnes por Giambi? ¿De dónde salió Jeter?
Y ¿por qué, preguntó un ejecutivo de la liga, no podemos medir todo eso?
La semilla del proyecto Statcast se plantó.