jueves, 23 de junio de 2011

Correlaciones, selección y el draft de la NBA

Un tiempo atrás, en unas apostillas, mostraba un artículo en el que se explicaba de manera muy sencilla cómo un proceso de selección puede ser fuente de correlaciones. El ejemplo de aquel artículo era una hipotética correlación negativa entre altura y velocidad en tenistas. La idea es que, aun suponiendo que no hay correlación entre ambas variables en la población en general, sí puede haberla en un grupo como los tenistas, si son atributos sustitutivos en este grupo. Esto es, las personas muy rápidas y altas pueden ser buenos tenistas. Ahora, si no sos alto, podés compensarlo siendo rápido y ser bueno igual. Asimismo, si sos lento, una buena altura puede compensar y podés llegar a mantenerte en el circuito profesional (todo esto es hipotético, claro está). Así, dentro de una población donde no hay correlación entre dos atributos, esta aparece dentro de una muestra de, por ejemplo, tenistas. La clave es que el criterio de selección (ser tenista profesional) está correlacionado con los atributos que estamos mirando. Si estos atributos fuesen, digamos, el factor RH de la sangre y la cantidad de letras del nombre de pila, es probable que esto no suceda.

¿Por qué volví a este tema? Resulta que esta noche se realizará el draft de la NBA. El draft es el proceso por el cual los equipos eligen a nuevos jugadores jóvenes, generalmente salidos del básquet universitario. Anteayer, este artículo de ESPN analizaba la relación entre la edad de los jugadores elegidos y su éxito posterior en la liga. Entre otros datos, el artículo presenta una tabla en la que se cuentan a los jugadores por su edad al ser elegidos en el draft y qué porcentaje de ellos llegó a ser un all-star, tomando esto último como una medida de éxito. En la tabla, se observa una clara relación negativa entre edad y porcentaje de all-stars. El artículo concluye que "el techo y el potencial de los jugadores más viejos es más bajo y sus carreras tienden a ser más cortas" (la traducción es mía).

La segunda parte de la conclusión es una perogrullada. Obviamente a un tipo más viejo le quedan menos años por jugar. La primera, en cambio, cae en la trampa del sesgo de selección. Veamos, está claro que un equipo intentará elegir al jugador con mayor potencial posible. También es razonable suponer que el potencial de un jugador más joven, digamos de 18 años, es más incierto que el de uno de 21 o 22 años que pasó los últimos tres o cuatro jugando a un nivel altamente competitivo como el del básquet universitario estadounidense.


Partiendo de esto, la clave de la tabla que muestra el artículo es que no está mostrando a todos los jugadores de básquet sino solo a aquellos que han sido elegidos en el draft y esa selección, claro está, no es aleatoria. Más aún, en el proceso de selección son determinantes la edad y el potencial de cada jugador. Como decíamos, el rendimiento futuro, es decir, el potencial de un jugador es algo incierto, por lo que cada elección en el draft implica un riesgo. Si creemos en el supuesto de que ese riesgo es mayor cuanto más joven es el jugador, podemos deducir que un equipo solo elegirá a un jugador muy joven si este muestra un potencial enorme: solo correrá un gran riesgo a cambio de la posibilidad de una gran recompensa. O bien, solo se elegirá a un jugador muy joven en aquellos extraños casos de un fuera de serie, de cuyo rendimiento futuro casi no caben dudas. Si miramos a los jugadores que han sido elegidos con menos de 19 años, podemos encontrar evidencia de esto: tenemos a superestrellas como Kobe Bryant, Lebron James o Dwight Howard y también a grandes fiascos como Darko Milicic o Robert Swift.

Así, un jugador de 18 años con potencial, pero no tanto como para llegar directamente a la NBA*, seguramente irá al básquet universitario a mostrarse e intentar ser elegido más tarde. Al final de cada año de su carrera universitaria, el jugador tiene la posibilidad de inscribirse como elegible en el draft. Pasados los 22 años**, esto no es necesario: los equipos pueden seleccionar a cualquier jugador que se haya graduado del secundario hace más de cuatro años sin necesidad de inscripción alguna. El resultado de este proceso es que prácticamente no queden jugadores de más de 22 años que no estén en la NBA y que tengan potencial de all-star. Los que eran lo suficientemente buenos, seguramente ya han sido elegidos a una edad más temprana y los que quedan, en el mejor de los casos formarán parte del reparto de un equipo, pero no serán estrellas (siempre hay excepciones, claro).


Si siguieron todo el cuento, la relación tiene que aparecer fácilmente: entre aquellos que fueron elegidos en el draft, habrá un porcentaje mayor de jugadores estrella entre los que fueron elegidos siendo más jóvenes. Pero esta correlación es consecuencia del proceso de desarrollo y selección de los jugadores, no de una relación intrínseca con la edad. Después de todo, cada jugador de 22 años alguna vez tuvo 19 y pudo haber ido a la NBA entonces. Así, el potencial (entendido como "el mayor rendimiento que puede alcanzar", no como "cuánto puede aumentar su rendimiento actual") de un jugador de 22 años no tiene por qué ser más bajo que el de uno de 19. Solo ocurre que a los primeros, si son muy buenos, ya se los llevaron a jugar profesionalmente.

Lo importante de todo esto es que cuando se mira la relación entre dos variables hay que pensar en el proceso que generó los datos que estamos mirando, tanto en términos de la muestra de que disponemos como en términos de la correlación misma y no dejarse engañar.

*Aquí me abstraje de un cambio relativamente reciente en las reglas de la NBA, por el cual la edad mínima para poder ser elegido en el draft aumentó de 18 a 19 años y se requiere que haya pasado al menos un año de la graduación del secundario. Esto, como era de esperar, generó que una cantidad importante de jugadores vaya a la liga universitaria por solo un año, como ocurrió con Kyrie Irving, quien tiene todas las fichas para ser la primera elección del draft de esta noche.

** En este caso, la regla también es un poco más compleja. Acá hay un detalle.

No hay comentarios.: