Stats & AnalysisUltimi articoliWimbledon

TML Classic: Finale Wimbledon 2008, Nadal vs Federer, Analisi statistica

Dopo la descrizione dettagliata della partita passiamo all’analisi statistica. Così come successo per la finale degli Australian Open 2012 e la semifinale tra Nadal e Djokovic al Roland Garros 2013 anche qui l’approfondimento sarà molto esaustivo e cercheremo anche di introdurre qualche nuovo parametro per descrivere determinati aspetti del gioco dell’uno o dell’altro contendente.

Punteggio

Si parte sempre dal punteggio che dice tanto, quasi tutto della partita, ma il quasi è più importante del tutto. 6–4, 6–4, 6–7(5–7), 6–7(8–10), 9–7. Questo ci dice che c’è stato un predominio nella prima parte della partita del vincitore che ha ottenuto almeno un break, o meglio un break in più rispetto all’avversario. I 2 tiebreak successivi ci indicano un certo equilibrio nel 3° e 4° set, soprattutto nel 4° in cui l’8 tra parentesi potrebbe indicare un match point sprecato così come di fatto c’è stato. Facile commentare il 9-7. Long set che va ad oltranza con un break per il vincitore. Di solito sono queste le partite che rimangono nella storia.

Palle break

Analizziamo il numero delle palle break salvare/sprecate (ricordando sempre che sono dati complementari). Entrambi i giocatori hanno dovuto affrontare lo stesso numero di palla break, 13, solo che Nadal ne ha salvare 12, mentre Federer 9. Incredibile come Nadal sia stato breakkato una sola volta in tutto il match e ha rischiato di perderlo nel 5° set quando Roger ha avuto palla break sul 4-3 30-40. Facile la proporzione 12/13 > 9 /13. Ci sono state palla break in tutti i set tranne nel deciso dal tiebreak. A Nadal è bastato un break per set per portarselo a casa. Match molto lineare dal punto di vista numerico.

Servizio

I dati del servizio ci dicono che Nadal ha messo in campo uno straordinario 74.3% di prime contro una percentuale sempre alta di Federer del 67.7%. Roger si è tenuto in vita grazie al rendimento con la prima, 73.5%, contro il 69.8% di Rafa che però prevale nel rendimento con la seconda: 57.1% vs 54.0%.

La prima di servizio

Ci si aspetterebbe una prevalenza della prima di servizio da parte di Nadal, almeno nei set vinti, ma non è andato così, anzi. Nel primo parziale Federer stravince nella realizzazione con la prima: 86.7% vs 70.6% eppure perde il set. Lo fa anche nel secondo: 70.6% vs 60.9%, stesso esito nel primo. Ancora prevalenza nel terzo: 81.5% vs 77.5% e questa volta porta a casa il set, ma solo al tiebreak. Solo nel i valori sono a favore del vincitore, ma di pochissimo: 71% vs 70.4% per Rafa così come nel anche se qui il gap aumenta 70.6% vs 67.4%.

Anche la RPW (Return Points Winner) presenta dei valori che pendono dalla parte di Federer. Vince sia nel primo: 35.7% vs 28%. Nel secondo: 40.5% vs 40% e nettamente nel terzo: 33.3% vs 21.1%. la percentuale gira nel quarto e il gap diventa piuttosto ampio nel quinto e decisivo set: 38.7% vs 30.6%.

La seconda di servizio

Come è logico aspettarsi se il perdente ha prevalso con la prima deve essere andato sotto con la seconda, altrimenti non avrebbe perso. Già il dato globale avvalora questa tesi: 57.1% per Rafa contro il 54.0% di Federer. Solo che andando a guardare i risultati set-by-set ci si accorge che non sempre il vincitore del parziale ha avuto un rendimento migliore con la seconda, come nel 1° e nel 4° set dove però ha fatto la differenza la prima. Dati un po’ contorti da questo punto di vista, che testimoniano un certo equilibrio complessivo che non è stato compreso da chi ha visto mezza volta questa partita.

I doppi falli

Qui continuiamo a ribadire il concetto che non conta il numero di doppi falli, ma quando sono arrivati. Per completezza diciamo che Nadal ne ha commessi 3, Federer 2, ma andiamo nel dettaglio.

Nadal

  1. Il doppio fallo di Nadal arriva sullo 0-1 40-15. quindi ininfluente. Si può “pesare” la gravità del doppio fallo usando il parametro volatility che stabilisce quanto un punto sia importante. Nel caso specifico la volatility è 1.4%, una quantità piuttosto bassa, come era prevedibile.
  2. doppio per Nadal nel 3° set 5-4 40-30. V = 2%. Ancora inifluente
  3. doppio fallo, il più grave nel tiebreak del 4° in vantaggio 5 punti a 2. V = 4.7%

Federer

  1. Primo doppio fallo di Federer che arriva nel 3° set sul 4 pari 30-0. V=1.8%, doppio fallo ininfluente.
  2. 5° set, 1-1, 40-30. Il doppio fallo a prima vista potrebbe essere ininfluente ma arrivato in questo punto della partita diventa relativamente grave e ha una volatility di 5.3%.

 

Vincenti/Non forzati

Come sempre il bilancio dei vincenti e dei non forzati lascia spazio a varie interpretazioni. La prima nasce spontanea perché questi dati non sono mai precisi al 100% o quantomeno riconosciuti all’unanimità motivo per cui il sito dell’ATP non li riporta mai, la seconda che è quella che pesa maggiormente è che nelle rispettive categorie sono inclusi colpi anche diametralmente opposti che però, seguendo semplicemente una regola di inclusione, sono messi tutti nello stesso calderone. Ma chiudiamo l’excursus filosofico per concentrarsi sui numeri.

Teorema Tommasi. Il differenziale complessivo dei vincenti e dei gratuiti è positivo per entrambi: +32 per Federer, +24 per Nadal. Straordinario risultato con un complessivo + 56 che testimonia una grande partita. Forse questa volta Tommasi ci ha preso. Gli unforced di Federer, 66, sono tanti ed è uno dei fattori determinanti per cui ha perso il match.

Differenziale FH e BH

Forehand.

Il differenziale complessivo tra W/UE di dritto denota un bilancio positivo per entrambi. Sostanziale equilibrio nei numeri con un +6 per Federer e +8 per Nadal. Bilancio sempre positivo per il numero 1 del mondo tranne che nel 5° set: +1 nel 1°, +4 nel 2°, +4 nel 3°, +5 nel 4° e un bel -8 nel 5° set in cui è andato sotto nonostante il punteggio indichi una certa parità. Nadal va sotto con il dritto solo nel 2° set con un -3 complessivo per sparare un +5 nel 5°, decisivo ai fini dell’assegnazione del match.

Backhand.

Il rovescio di Federer non ha funzionato e contro Nadal non c’è da meravigliarsi. Impietoso -10 complessivo nel differenziale W/UE, mentre Nadal si salva con un dignitoso -1. Dove è mancato il rovescio di Federer è stato nel primo set con un netto -5 ed è qui forse che viene suffragata l’idea di un numero 1 del mondo così remissivo nel primo parziale, diremmo quasi dominato.

Vediamo il bilancio complessivo set-by-set

  1. -2 Federer, +4 Nadal
  2. +7 Federer, +5 Nadal
  3. +4 Federer, -3 Nadal
  4. +13 Federer, -1 Nadal
  5. +22 Federer, +13 Nadal

Key Points

Ed ecco di nuovo i nostri key points. Per chi si fosse perso la puntata precedente essi sono i punti chiave ossia quei punti che fanno girare un game da una parte o dall’altra. Sono divisi in 3 categorie in ordine di importanza: in prima fila i break points che sono essenziali, secondo gradino per i game points e terzo per i deuce points, i punti che si giocano sulla parità.

Già si è parlato delle palle break nella sezione apposita, ma ricordiamo l’12/13 di Nadal e il 9/13 di Federer. Tradotto significa che Rafa è stato maggiormente attento ad annullare le palle break. Federer ha messo in campo 9 volte la prima quando ha dovuto fronteggiare una palla break contro le 8 di Nadal. Percentuale molto simili. Ottimi i 2 ace di Roger contro gli 0 di Nadal. Nato importante i 4 servizi vincenti del numero 2 del mondo: 4 contro i 3 dell’avversario. Dato che abbiamo avuto di evidenziare anche nella cronaca set-by-set. Grave, seppur l’unico, unforced di Federer.

In generale Federer ha vinto in percentuale tutti i punti più importanti sia per quanto riguarda i game points: 67% vs 59%, i Svg Deuce: 79% vs 67%. Anche nel computo totale Federer è davanti, ma solo a livello di percentuli, a livello di numeri spicca quell’89 Nadal contro il 71 di Roger che poi si traducono in 59 vs 50, in sostanza Rafa ha dovuto affrontare il maggior numero di palla critiche e ne ha vinte abbastanza da portarsi a casa il match.

Winning Probability

 

Ritorna di prepotenza la winning probability che attraverso un grafico in 2 dimensioni molto semplice ci regala una radiografia della partita. L’andamento del match point-by-point è un dato imprescindibile per una analisi che vuole essere dettagliata e condivisa da tutta, se poi questa è corroborata da un grafico che dà l’idea immediata di come la partita sia andata in un verso o nell’altro sia a cavallo.

Ribadiamo alcuni concetti che sono alla base di questo tipo di analisi. Entrambi i giocatori partono dalla stessa percentuale di probabilità di vincente, quindi 50 e 50, si assegna una p di probabilità di ottenere il punto sul proprio servizio e grazie ad un particolare algoritmo si calcola punto per punto quant’è la probabilità che uno giocatore porti a casa un match. In alcuni studi la p è diversa per i 2 giocatori. Una scelta plausibile che però trova il difetto di produrre dei grafici in cui chi ha la p maggiore ha sempre una WP maggiore del 50% e solo nei casi in cui sta perdendo malamente il match questa scende sotto il livello del 50%. Questo tipo di approccio è utile per le agenzie di scommesse che lo adottato per dare le quote live, ma non è utile in un’analisi a posteriori perché un giocatore favorito avrà sempre numeri alti nonostante magari in certe situazioni si trovi pesantemente sotto nel punteggio.

Non ci vuole tanto a capire che Nadal ha dominato in lungo e in largo. Dopo le prime fasi di studio il break è arrivato nel 3° gioco. Da lì in poi solo rosso nel grafico che accentua il dominio dopo la virata alla boa del 2° set con un 87.5% di probabilità di vittoria. Con la vittoria del 3° parziale Federer riaccorcia ma solo momentaneamente. Siamo sempre in zona rossa fino al tiebreak che presenta 2 peak a al punto 1, 95.8% che è il primo match point del tiebreak del 4° sul 7-6 poi replicato nell’altro match point con wp di 90.7%. 3 punti consecutivi di Federer riportano la wp al 50% con uno sbalzo piuttosto netto e la volatility lo dimostra. Nel quinto set si comincinoa a vedere le prime strisce blu con Federer avanti perché serve per primo, raggiunge il suo peak al punto 3 con il 27.8% che corrisponde al 3-4 servizio Nadal 30-40. Annullata questa palla break Roger non avrà altre occasioni importanti. Dapprima è Nadal ad aver un altro peak al 75% con le 2 palle break dell’11° gioco. Wp che poi schizza verso il 100% con il break Nadal al 15° gioco.

Il dominio

La netta prevalenza del colore rosso del grafico ci dice che è stato Rafa a “dominare” avendo avuto maggiori picchi ed essendo stato per molto più tempo in vantaggio. La vittoria finale gli consegna definitivamente lo scettro del dominio del match che in termini di percentuale di traduce con un:

67.8% Nadal e 32.17% Federer.

Comeback factory

Il comeback factory misura in termini numerici la consistenza della rimonta del vincitore. Il nostro amico Jeff Sackmann la calcola come l’inverso della più bassa WP del vincitore, ma io dico che è meglio non fare conti in più e dare numeri adimensionali che non dicono niente. Seguendo Jeff dovrei dire che il CF è stato di 2.94, sì ma che vuol dire? Meglio dire che Nadal ha avuto il picco più basso del 27,6% di WP per cui ha guadagnato il 72.4% di WP per aggiudicarsi l’incontro. CF =72.4%. Grande risultato, ma ce ne sono stati di più clamorosi come il CF della semifinale del Roland Garros 2013 pari a 85.6%.

Excitement index

Siamo arrivati al punto più controverso delle statistiche avanzate del tennis ossia cercare di quantificare quanto un match sia stato eccitante-bello. Inutile dire che non potrà esistere un metodo universalmente condiviso, ma andare a quantificare quanto il match ha avuto capovolgimenti di fronte che sono alla base di una partita “eccitante” è un buon inizio. L’EI si basa sulla volatility che misura quanto il punto sia stato importante (già c’è stato un accenno nella sezione doppi falli). Sempre il nostro amico Jeff la quantifica come differenza in termini di percentuale tra la probabilità di  vittoria del punto da parte del servitore e quella di perdere il punto successivo. Definizione che lascia il tempo che trova personalmente, così mi sono permesso di semplificarla dicendo che la volatility è la differenza in valore assoluto tra la WP del punto precedente con il punto corrente. Mi sembra una definizione più consistente perché in termini pratici misura quanto quel punto ha fatto cambiare le sorti del match e di conseguenza quello che sposta maggiormente la WP è il più importante. Un punto con v compreso tra 1 e 3% è un punto ininfluente, dal 4 al 6% comincia ad essere caldo, dal 6 al 10% è fondamentale, sopra il 10% è un punto che fa girare tutto.

In questa partita il punto più importante ha avuto una volatility del 23.4% che è il punto che dà il break a Nadal del 5° set che lo porta dal 8-7 e a servire per il match.

Quant’è l’EI allora? 3,11 E’ alta, è bassa, chi lo sa? In questi casi i numeri adimensionali dicono poco o nulla se presi singolarmente, per avere senso bisognerebbe fare un confronto con le altre partite. Un esempio: semifinale del Roland Garros ha avuto EI 2,88 che è inferiore a questa. Quella degli Australian Open 2009 2,712. Le partite dominate si attestano attorno all’1. Quindi possiamo concludere che questa partita è stata parecchio eccitante una con le più alte EI mai registrate.

Domination ratio

Per chi l’avesse dimenticato la dominatio ratio è data dal rapporto della percentuale dei punti vinti in risposta e quella dei punti persi al servizio. Che cosa ci dice? Ci dice quanto un giocatore è stato dominante rispetto al suo avversario in un set o nell’intero match. Nella maggior parte dei casi questa arride al vincitore ma può capitare che il vincitore lasci tanti punti al suo avversario pur vincendo quelli più importanti. La DR in questo caso premia il perdente.

Del dominio nel match ne abbiamo parlato così è meglio concentrarsi su quella dei singoli set

Set 1

DR(Nadal) = (1/5 + 4/6 + 0 + 2/6 + 0) / (2/6 + 5/12 + 1/5 + 1/5 + 6/14) =0.76

DR(Federer) = 1.31

Set 2

DR(Nadal) = (0 + 2/6 + 0 + 4/6 + 4/5) / (4/6 + 1/5 + 2/6 + 4/10 + 4/10) = 0.9

DR(Federer) = 1.11

Set 3

DR(Nadal) = (0 + 1/5 + 0 + 3/8 + 2/6 + 1/5 + 1/6) / (2/6 + 3/7 + 5/12 + 1/5 + 4/10 + 0 + 2/6) = 0.60

DR(Federer) = 1.66

Set 4

DR(Nadal) = (1/5 + 1/5 + 3/8 + 2/6 + 2/6 + 2/6 + 4/9) / (1/5 + 2/6 + 1/5 + 0 + 1/5 + 1/5 + 5/9) = 1.31

DR(Federer) = 0.76

Set 5

DR(Nadal) = (2/6 + 4/10 + 3/8 + 0 + 2/6 + 3/8 + 4/10 + 6/10) / (2/6 + 1/5 + 1/5 + 3/8 + 2/6 + 1/5 + 2/6 + 3/8) = 1.20

DR(Federer) = 0.83

Service domination e return domination

Per concludere aggiungiamo qualche altro parametro tanto per dare pepe alle stats. Il primo riguarda il servizio. Ossia: quanto ha inciso il servizio nella dinamica della partita? Non ci addentriamo in calcoli astrusi semplicemente stimiamo i punti vinti al servizio dai 2 giocatori e li rapportiamo al totale.

La SD nei rispettivi set è stata del 67.16%, 59.68%, 71.91%, 69.05%, 64.86%.

La retun domination, RD, è il reciproco in termini di percentuale della SD e misura quanto sia stata incisiva la risposta. Non è difficile arrivare alla soluzione.

La RD set-by-set è stata del 32.84%, 40.32%, 28.09%, 30.95%, 35.14%.

SD(totale) =((27 + 18 + 22 + 15 + 34 + 30 + 28 + 30 + 34 + 38) / (34 + 33 + 32 + 30 + 42 + 47 + 43 + 41 + 58 + 53))*100 = 66.82%.

Percentuale piuttosto bassa per un match su erba.