The GOAT Theory: Critiche all’algoritmo di The Tennis Base

tennismylife Settembre 29, 2017Settembre 29, 2017 1.836 Comments

Dopo aver analizzato il sofisticatissimo algoritmo progettato da TheTennisbase veniamo alle critiche. Innanzitutto questo articolo non vuole essere un dito puntato contro il grande lavoro fatto dalla staff del sito e dei suoi collaboratori (uno dei quali di nostra conoscenza) . Non vuole essere un grido:”Sì, ok, ma voi non capite niente“. Anzi, la premessa è chiara: Il lavoro di TB è eccezionale e non può che essere elogiato. Ma tolta questa premessa veniamo ai punti controversi dell’algoritmo del GOAT (che non vuol dire nulla, si chiama così solo per avere i finanziamenti del Ministero della Pubblica Istruzione e Ricerca, se si chiamasse in un altro modo nessuno pagherebbe un euro per questa ricerca).

Il TB ranking

L’idea di stile un ranking nei grandi buchi lasciati dall’ATP è un ottimo lavoro, solo che questo presenta dei difetti non trascurabili. Innanzitutto non mantiene la cadenza settimanale che ha il ranking ATP per cui ci si trova ad avere giocatori che occupano una determinata posizione, soprattutto la prima, per settimane e settimane anche se hanno perso punti o guadagnato punti. Il week-by-week dovrebbe essere alla base se, come succede, le settimane da numero x sono importanti o i mesi o addirittura solo le stagioni, quindi ranking di fine anno. Il TB ranking ricalca lo stesso errore insito nelle prime versioni del ranking ATP con tanti buchi venuti fuori da ricerche estese soprattutto compiute dal giornalista argentino Puppo che ha scoperto che per qualche settimana nel 1975 e 1976 Vilas si ritrova ad essere numero 1 del mondo mai riconosciuto come tale proprio perché l’ATP latita nel pubblicare il ranking in quelle particolari settimane.

Un altro difetto del TB ranking è il taglio a 16 tornei. Un taglio piuttosto netto che ha un suo significato preciso nel tennis attuale, ma negli anni ’60, ’70 e ’80 i giocatori erano soliti giocare anche 30 tornei l’anno. Lendl nel 1980 ne giocò 32 tra WCT e Grand Prix tralasciando le “esibizioni”. Difficile in questi casi tenere fuori così tanti tornei, non renderebbe giustizia a Ivan così come ai suoi colleghi che hanno fatto altrettanto. La categorizzazione A = Slam, B = M1000, C = ATP500 non trova un riscontro immediato nei tornei giocati prima del 1990 per cui si ha un’altra forzatura, un’imposizione grave. Sarebbe d’uopo usare delle proporzioni ad hoc, ma il quadro si complicherebbe non poco.

Privilegio del tennis più attuale

Uno dei punti più controversi dell’algoritmo usato da TB è quello di dare maggiore peso alle stagioni attuali piuttosto che a quelle passate. E qui non ci siamo. Il caposaldo fondamentale per avere un confronto equo è quello di avere dei tennisti che si trovano sullo stesso piano, senza privilegi da una parte o dall’altra. Come è facile immaginare dare un maggiore peso al presente fa pendere la bilancia verso l’attualità declassando i tennisti del passato che hanno la loro dignità pur non giocando in un circuito organizzato e soprattutto ricco come quello attuale. Se voglio stabilire chi ha fatto meglio tra Tilden e Federer non posso non considerare gli US Open vinti equipollenti, anzi quelli degli anni ’20 dovrebbero avere un peso maggiore perché gli Slam/Major non erano 4 come oggi, o meglio lo erano, ma non tutti li consideravano tali, soprattutto l‘Australian Championships. Quello che si può fare è pesare i tornei in base al tabellone e al field ma questo rientra in un altro ambito che non approfondiremo qui.

Categorie

La categorizzazione dei tornei su TB cerca di ricalcare quella attuale, ma non è così fedele, diciamo al 100%. Nell’era pre-Open ci sono ben più dei canonici 4 tornei di category A perché si parte dall’assioma che i tornei dello Slam lo siano a prescindere e a questi si aggiungono i tornei del Grand Slam Pro + le World Series. Qui si complica molto la situazione perché i 3 insiemi di tornei sono completamente differenti dal punto di vista strutturale e giocati da tennisti che possono partecipare solo agli uni e non agli altri. Questa logica avrebbe senso se si distinguessero 2 carriere e 2 classifiche: dilettanti da un lato e professionisti dall’altro. Visto che però l’algoritmo non fa questa distinzione il minestrone è ben servito. Lo stesso problema vale per la categoria inferiore, la B, qui la differenza tra i vari tornei è molto più labile, ma vale lo stesso ragionamento del punto precedente: o si fissano a 9 come per il sistema attuale, o metterne 10-12 con un taglio a 16 tornei disallinea la comparazione che necessita di parametri omogenei.

Bonus all’interno dell’algoritmo

Un’altra critica all’algoritmo di TB che non riguarda tornei o ranking è il modo con cui vengono assegnati i punti bonus. In sostanza i bonus per aver battuto un Top 200 non vanno ad incrementare il punteggio del ranking, bensì il punteggio totale. Un disallineamento non da poco. Nell’ottica generale è plausibile però così si va a dare un peso enorme a delle vittorie che fanno lievitare le quotazioni di un tennista, senza poi considerare che i punti bonus sono molto elevati in proporzione alle vittorie dei tornei. Come è facile intuire sarebbe d’uopo assegnare bonus per il TB ranking in base alle vittorie contro Top 200. Problema molto veniale questo, ma c’è.

Gli H2H

Gli H2H contano, non contano? Domanda banale e che appartiene solo alla blogsfera. Gli H2H come dice la parola stessa servono a misurare il rapporto di forze nello scontro diretto che non implica nessuna conseguenza nel confronto tra carriere. Ma l’algoritmo di TB non sta certo a guardare queste sottigliezze, però ci fa un pensierino, che parte da questo presupposto: perché non premiare chi nel corso della carriera ha battuto più volte un tennista piuttosto che averci perso? Non è malaccio come idea, però ritorna il problema ricorrente che è quello di assegnare punti in più in base a delle vittorie che arrivano per diverse circostante, favorevoli o sfavorevoli. Inoltre l’algoritmo non tiene conto del “peso” di questi H2H: un conto è essere avanti 1-0 con un tennista, un altro 23-15. Se si vuole fare questo tipo di inclusione bisogna usare il setaccio e di conseguenza complicare il tutto, altrimenti si rischia di fare degli errori strutturali non indifferenti anche se mitigati dal fatto di essere un bonus aggiuntivo e non un dato fondamentale per il calcolo del punteggio. Se fossi io a decidere li toglierei del tutto.

La sproporzione o non proporzione ranking/tornei

La critica principale che va fatta all’algoritmo di TB è la mancanza assoluta di proporzioni. Spiego meglio: il sistema generale di assegnare x punti per il raggiungimento di un determinato obiettivo è di base fallace se non si considerano tutte le varianti in campo e a quanto equivale un determinato goal rispetto ad un altro che dà gli stessi punti TB. Facciamo un esempio: fare il Grande Slam dà 30 punti TB, una settimana al numero 0.80 punti, numero 1 a fine anno 20 punti. Questo significa in soldoni che il Grande Slam “equivale” a chiudere l’anno al numero 1 per una sola volta + 11 settimane al numero 1. Semplice. Detta così sembra un po’ banale, ma in effetti i calcoli sono giusti. La domanda è la seguente: siamo sicuri che questa proporzione funzioni? Nella percezione generale il Grande Slam assume un ruolo essenziale nella carriera di chi lo realizza per cui il raggiungimento dell'”equipollente alternativo” dovrebbe “pesare” di meno, almeno sulla carta. Non è facile trovare il giusto mezzo, ed è questo il punto focale di tutti questi algoritmi: trovare le proporzioni tra grandezze tra loro non equiparabili per definizione. Sarà questa la base delle discussione successive, si dovranno tenere conto, anzi dovranno essere alla base di tutto. Quindi, niente punteggi senza nessuna correlazione tra loro.

Il Grande Slam

Perché Rod Laver è davanti a Federer nell’output di questo famoso algoritmo? Per 2 motivi: uno riguarda il maggior numero di settimane al numero 1 di Laver, che, come già accennato in passato, non sono frutto di un ranking ufficiale, ma di uno costruito ad hoc con i relativi buchi. Ma non è questa la critica che vogliamo fare. Il punto che vogliamo attenzionare è il bonus extra che viene dato al Grande Slam. Di questi bonus ce ne sono di diversi tipi: per il Grande Slam classico, il Grand Slam Pro, il Grande Slam virtuale e il Career. The Rocket si becca ben 3 bonus extra con i 2 Grand Slam del 1962 e 1969 e quello Pro del 1967. In soldoni Laver prende 30+30+25 = 95 punti TB extra per aver vinto dei tornei che di per sé sono già pesanti. Federer prende il bonus per il career: 20 punti. Ritorna sempre con la questione della proporzione. Il Career che si può raggiungere solo una volta ha lo stesso numero di punti TB della chiusura dell’anno al numero 1. Una proporzione che ci può stare, ma bisognerebbe prima ponderare questi numeri, pesarli con tutti gli altri e poi assegnare loro i punti dopo.

Max performance e Track record

Questi 2 parametri sono a mio avviso da rivedere. Hanno la loro logica nell’insieme, ma aggiungono numeri che hanno poco a che fare con gli altri già calcolati, sempre con l’handicap delle proporzioni. Il primo vorrebbe premiare il dominio di un tennista nell’arco di un certo periodo, ma già la vittoria di titoli e la prima posizione del ranking danno abbastanza punti. Stesso discorso vale per il track record che è il parametro più aleatorio possibile. Assegna un bonus a chi fa registrare determinati record. Ok, ma chi ci dice quanto valgono questi record? Perché uno deve essere più importante degli altri? O 2 sono sullo stesso piano? Nessuno ce lo può dire. Questo sarebbe un parametro da eliminare anche se aggiunge poco nel computo totale e premia solo chi sta in alto, gli altri che stanno in basso hanno pochissimi punti provenienti da questo bonus, ma o pochi punti o tanti punti inutili rimangono sempre inutili.

La critica di Lleyton

E’ un po’ ridondante considerare anche le settimane da n.1/ 2 /5 ecc. e dare il bonus ranking nel momento in cui si considerano TUTTI i tornei e TUTTI i piazzamenti. In questo modo si avvantaggiano esponenzialmente i più vincenti (o comunque quelli che accumulano più punti), al di là del valore pre-stabilito del torneo (e andando quindi a sfasare e non di poco il bilanciamento operato inizialmente). Cioè se io, valutando e ponderando attentamente, arrivo alla conclusione che vincere il torneo x vale 10, quello y 5 e quello z 3, ma poi attribuisco bonus al n.1 delle classifiche un bel +1 al mese, non finisce che in realtà chi vince il torneo 10 avrà un bel po’ di bonus +1 (e quindi il torneo x, de facto, non varrà più 10, ma 12 o 15 o boh) mentre y e z continueranno a valere 5 e 3.

Stesso discorso per i piazzamenti e dal punto di vista quantitativo (vinco una marea di tornei “ceppa” ma che mi fanno salire in classifica)

Cambierei anche i category A Slam da 1500 a 2000 (meglio 2500) + il rapporto tra W e F 100-40 anziché 100-60 -> classifica finale verosimile.