Universal Rating System: se ne sentiva la mancanza?
6 min read
(UnoScacchista)
Qualche volta le innovazioni colmano un vuoto, una necessità o fanno avverare un sogno; altre volte, semplicemente, re-inventano qualcosa che c’è già, modificandolo in maniera marginale a fronte di un presunto miglioramento sostanziale. A Dicembre 2016, gli organizzatori del Grand Chess Tour annunciarono che le tre wild cards del Tour sarebbero state assegnate non in base alla lista Elo, ma secondo la lista del nuovo URS – Universal Rating System.
Siamo abituati da decenni a valutare e confrontare la forza dei giocatori con il metodo elaborato dal prof. Arpad Elo e adottato dalla FIDE nel 1970. Basato sulla stima del risultato atteso in ogni partita per ogni giocatore in funzione della propria abilità (ovvero del suo punteggio Elo) e dell’abilità dell’avversario (anch’essa quantificata con il suo punteggio Elo), il metodo resiste tutt’oggi, grazie a qualche piccolo accorgimento correttivo. Non è stato e non è tuttavia scevro da critiche, in particolare per l’effetto di “inflazione” del punteggio negli anni, che impedisce di paragonare concretamente la forza di gioco di giocatori distanti decenni confrontando semplicemente i loro punteggi Elo.

Nel 2002, il matematico e statistico Jeff Sonas presentò il suo Chessmetrics, che adotta una media pesata delle partite giocate in precedenza da un giocatore, con un fattore di attenuazione che è funzione del tempo trascorso da ogni singola partita. Questo metodo presenta vantaggi e svantaggi rispetto al metodo Elo, ma permette di confrontare in maniera più corretta i giocatori in intervalli temporali diversi. Chessmetrics non è mai stato adottato ufficialmente della FIDE ed è stato abbandonato a Dicembre 2004.

Molto interessante anche il contributo di Rod Edwards, che con il suo Edo Historical Chess Rating ha provveduto a calcolare, un indice di prestazione sulla base dei risultati di incontri e tornei a partire dal 1820.

Una rappresentazione molto accattivante dei migliori 10 giocatori al mondo a partire dal 1820 e finire al 2016 è stata realizzata dall’utente Facebook “abacaba”: ve la mostro qui sotto.
Come dicevamo, il punteggio Elo è stato calcolato dalla FIDE a partire dal 1970 per tutte le partite giocate con cadenza “lenta” in incontri FIDE ufficiali e tutti noi ci siamo abituati alle pubblicazioni periodiche delle classifiche Elo, così importanti sia per rappresentare la forza dei giocatori (noi stessi inclusi!) sia per assegnare i titoli FIDE e guidare gli organizzatori dei tornei nella scelta dei giocatori da invitare. La frequenza di aggiornamento, inizialmente semestrale, è stata poi via via aumentata fino alla attuale cadenza mensile, che è più aderente al principio del metodo, in quanto permette di avere stime del punteggio atteso più fedeli alla forza attuale dei giocatori.
Oggi c’è chi offre anche il punteggio Elo in tempo reale per i primi 100 giocatori in assoluto e per le prime 50 giocatrici: è il sito LiveChess Rating, che, iniziato da Hans Arild Runde come sito in grado di tracciare le modifiche giorno per giorno dei giocatori sopra i 2700 Elo (da ciò il nome del sito web), è poi stato trasformato in una servizio con i fiocchi, in grado di offrire anche grafici di confronto tra i giocatori.

Dal 2012, la FIDE ha iniziato a calcolare e pubblicare anche le graduatorie Elo per le partite Rapid e Blitz, cercando di dare risalto e notorietà anche agli specialisti di queste cadenze. Se oggi la classifica Elo “classica” vede in testa Carlsen seguito da So, Kramnik e Caruana, la classifica Rapid è sempre guidata da Carlsen, ma dietro di lui ci sono Ivanchuk, Mamedyarov e Grischuk, mentre la classifica Blitz vede in testa il solito Carlsen, con dietro Nakamura, l’ucraino Iuri Shkuro (che gioca solo tornei blitz e rapid, questi ultimi con risultati mediocri) e Vachier-Lagrave.
Così come nel tennis ci si chiede sempre se sia corretto avere una unica classifica ATP per le tre principali superfici di gioco (terra, erba e cemento), anche negli scacchi c’è chi si è chiesto se sia corretto mantenere le tre classifiche separate o se sia più corretto valutare la forza di un giocatore sulle tre specialità, combinando in qualche modo i risultati delle partite nei tornei classici, Rapid e Blitz.
Ovviamente la domanda filosofica di base è: gli scacchi blitz sono lo stesso gioco degli scacchi a cadenza lenta? Se la risposta è no, allora le tre graduatorie Elo hanno perfettamente senso, altrimenti la questione di un metro di giudizio unificato non è peregrina.
Grazie a un progetto di ricerca finanziato dal Grand Chess Tour, dalla “Kasparov Chess Foundation” e dal “Chess Club and Scholastic Center” di Saint Louis (USA), quattro ricercatori, Maxime Rischard, Isaac Miller, Mark Glickman, e (di nuovo lui) Jeff Sonas, hanno progettato, implementato, validato e rifinito l’algoritmo Universal Rating System (URS™), la cui applicazione è iniziata con la classifica pubblicata l’1 Gennaio 2017.
Vi risparmio i dettagli matematici, che potete trovare sul sito ufficiale dedicato all’algoritmo URS™, ma vi posso dire che l’algoritmo non considera affatto il punteggio Elo e applica il “metodo regolarizzato della massima verosimiglianza, corretto con un peso temporale” (“time-weighted regularized maximum likelihood calculation“): tutto chiaro?
Penso siate curiosi di vedere la classifica al 1 Giugno:
Non è certamente una sorpresa vedere Carlsen in testa alla classifica, ma le posizioni di rincalzo sono abbastanza rimescolate, pur se non in maniera astrusa. Molto interessanti gli indici “Rapid Gap” e “Blitz Gap”, che rappresentano sinteticamente la differenza di prestazione relativa del giocatore passando dalla cadenza classica a quelle veloci: più alto è il Gap, peggiore è la prestazione a cadenze veloci. Ad esempio, tra i primi 20 Nepomniachtchi è il giocatore che gioca meglio Rapid (Gap = 18), mentre So e Kramnik sono quelli che risentono maggiormente del minor tempo di riflessione (Gap = 32). Analizzando il Blitz, è chiaro che Caruana, notoriamente non così forte a questa cadenza, ha il Gap più alto (93), mentre si conferma giocatore abile alle cadenze veloci Nepomniachtchi (51) con Nakamura, leggendario giocatore Blitz e Bullet (57), Carlsen e, sorprendentemente, Andreikin, che non se la cavano affatto male (Gap=58). Colpisce l’assoluta parità tra So e Kramnik sia come punteggio sia come Gap a tutte le cadenze.
Come detto all’inizio dei questo articolo, il punteggio URS™ è stato già utilizzato praticamente dagli organizzatori del Grand Chess Tour: le tre Wild Cards per il GCT 2017 sono infatti state proposte a Nepomniachtchi, Karjakin e Anand grazie alla loro posizione nella lista URS™ di Gennaio 2017, nella quale erano 6°-7° e 9° e primi dei non qualificati.
Gli ideatori e i finanziatori dell’URS™ sono convinti che questo metodo sia superiore all’Elo e sia addirittura applicabile a sport diversi dagli scacchi. Non so giudicare la bontà di questa affermazione, ma posso sicuramente dire che l’applicazione dell’algoritmo è impossibile senza una base storica sulle partite giocate da ogni singolo giocatore ad ogni cadenza di gioco, per cui non potrà essere certamente essere usato a livello “amatoriale”. Che poi il futuro degli scacchi stia nella valutazione della forza dei giocatori a tutte le cadenze di gioco o solamente a cadenza “regolare”, è tutto da dimostrare. E, probabilmente, molto dipende dalla organizzazione di tornei a cadenza mista, come, di fatto, è il GCT e come, con modalità peculiari, è il torneo di Zurigo “Memorial Korchnoi”.
A voi la parola finale per rispondere alla domanda del titolo: sentivate la mancanza di un metodo per calcolare la forza di un giocatore a cadenze di gioco diverse, come l’URS™?
Giocare “classic”, “rapid” o “blitz”: tre diversi stili e tre diverse filosofie di gioco. Eccellere nell’uno o nell’altro, o in tutti, non è per me indice di maggiore o minore bravura, ma solamente di una capacità di adattamento delle proprie capacità ai tempi di gioco. Pertanto un eccellente giocatore classic non dovrebbe essere penalizzato se la sua resa nel rapido o nel blitz non è di pari livello. Aggiungo una domanda: e se un eccellente giocatore di classic, per sua scelta, non facesse mai tornei rapid o blitz? Non sarebbe eccessivamente penalizzato se la FIDE adottasse il metodo URS?