La formule de Kelly

Nous ne faisons pas ici référence à Kelly de Beverly Hills 90210, mais à John Larry Kelly Jr, mathématicien américain célèbre pour avoir formulé en 1956 le critère de Kelly, qui permet d’optimiser un budget placé dans un système soumis à des probabilités.
Une application simplifiée est la formule de Kelly, et notamment celle appliquée dans une distribution multinomiale, typiquement une course hippique.
Nous allons étudier la formule de Kelly en l’utilisant dans 2 méthodes différentes de calcul.

Méthode 1
Le principe sur lequel se base Kelly est relativement simple :
Il ne faut jouer un pari que si l’espérance de gain net de ce pari est supérieure à l’espérance de perte.
Appliquons ceci au cas du pari en simple gagnant, pour illustrer la formule.
On nomme :
Fi la fraction du budget jouée sur le cheval (on prendra un budget de 100€ dans cet exemple)
Pi la probabilité de victoire du cheval i. 1-Pi est donc la probabilité de perte de ce cheval.
Ci la cote du cheval i et Ri son rapport. On a Ci=Ri-1
Le principe ci-dessus s’écrit pour chaque cheval i:

    \[ Fi.Pi.Ci > Fi.(1-Pi) \]

soit

    \[ Pi>1/(Ci+1) \]

ou encore

    \[ Pi-1/Ri >0 \]

Si cette condition est vérifiée Kelly indique dans la formule du pari simple (qu’on utilise dans cette méthode) qu’il faut miser :

    \[ Fi= Pi-\frac{1-Pi}{Ci}=\frac{Pi.Ri-1}{Ri-1} \]

Notons que si on prend Pi comme étant proportionnel aux enjeux, alors comme nous l’expliquons ici on a Pi=TRJ/Ri
et donc la formule de Kelly revient à sélectionner les chevaux pour lequel (TRJ-1)/(Ri-1) est positif et le plus élevé, mais comme TRJ<1 et Ri>1, alors il n’y a aucun cheval qui peut répondre à cette condition.
Si on considère que les probabilités sont proportionnelles aux enjeux, d’après la formule de Kelly, il ne faut donc pas jouer.

Nous allons donc dans la suite de cet article utiliser des probabilités attribuées de façon aléatoire, sur l’exemple de la course R4C8 du 1er avril à Reims:

La méthode 1 fournit alors les résultats suivants:

Les probabilités aléatoires attribuées aux chevaux 7 et 8 ne vérifient pas Pi-1/Ri >0, on ne les joue donc pas.
On voit aussi que la méthode ne fait pas jouer la totalité du budget, mais seulement 37,17% (et 34% lorsqu’on arrondit les mises).
Mais on remarque surtout que si le cheval 4 est gagnant, alors le gain net est négatif, ce qui est un point faible dans notre jeu ici.
Dans ce calcul on voit cependant que les mises sont calculées pour chaque cheval de façon indépendante, car on considère dans la formule du pari simple de Kelly qu’on a des paris individuels et indépendants. On sent bien que chaque fraction de budget devrait plutôt être calculée en prenant en compte les autres, car on cherche à optimiser l’espérance de gain de façon globale, sur un ensemble de paris interdépendants.
Nous allons viser cela dans la seconde méthode ci-dessous, pour tenter d’améliorer ce premier résultat.

Méthode 2
Etudions donc maintenant une 2ème méthode utilisant la formule de Kelly fournie pour des paris sur plusieurs paris possibles, et citant justement le cas des paris hippiques.
La formule de Kelly est dans ce cas énoncée ainsi:

    \[Fi= \left\lbrace \begin{array}{ccc} Pi-\frac{Br}{Ri-1}  & \mbox{si ce r\'esultat est positif}\\ O & \mbox{sinon}\\ \end{array} \]

où Br est le pourcentage du budget initial restant à chaque itération.
Cette méthode est en effet itérative, ce qui va permettre de prendre en compte, pour chaque pari sur un cheval, les paris déjà faits sur les autres chevaux.

De façon précise, l’article présentant la formule indique:
« Une méthode itérative consiste à commencer par sélectionner le cheval pour lequel Pi-1/(Ri-1) est le réel positif le plus élevé, et y allouer (provisoirement) cette part du budget. On calcule Br, on cherche le deuxième « cheval » le plus intéressant et on recalcule les parts de budget à allouer aux deux chevaux. En recommençant cheval après cheval, on arrête lorsqu’il n’y a plus de cheval intéressant. La répartition atteinte à ce moment est celle de Kelly. »

On procède donc par itération dans nos calculs: après sélection d’un cheval on recalcule Br(k) à l’itération k suivante, puis on recalcule avec Br(k) les fractions Fi(k) pour chaque cheval précédemment sélectionné, et on rajoute le cheval suivant (et n’ayant pas déjà été « joué ») dans la liste, par fraction décroissante.
Cela donne sur notre course test, à l’itération 1 (k=1) soit avec Br(1)=1:

On sélectionne donc le cheval 2 et on lui attribue temporairement F2(1)= 13,28%
On calcule Br pour l’itération2 : Br(2)=1-13,28%=86,72%
On recalcule Fi en dernière colonne et on a pour l’itération 2 :

On a maintenant F2(2)= 13,50%
Le cheval suivant dans l’ordre de Fi décroissant est le cheval 1 avec F1(2)= 8,96%
On calcule Br(3)=1-13,50%-8,96%=77,54%
On recalcule alors les fractions :

F2(3)= 13,66%
F1(3)= 9,07%
Le cheval suivant dans la liste est le 5 et on a F5(3)= 6,66%
On continue ainsi jusqu’à avoir joué tous les chevaux avec Fi(k) positif.
Au final cela donne:

On voit ici que les résultats sont assez proches de ceux trouvés avec la méthode 1; le cheval 4 est cependant joué ici avant le cheval 6 (et n’apporte plus de perte mais un gain net nul en cas de victoire), et les pourcentages sont légèrement différents. On a ici joué environ 43,43% du budget (43% avec les mises arrondies).

Quelle méthode choisir?
Pour déterminer la méthode la plus performante, on peut calculer sur notre exemple l’écart entre espérance de gain totale et espérance de perte totale, soit:

    \[\Delta(Esp)= \sum_{i}{Fi.Pi.(Ri-1)}-\sum_{i}{Fi.(1-Pi)} = \sum_{i}{Fi.(Pi.Ri-1)} \]

Cela donne :
– Méthode 1 (budget total joué: 37,17%):

    \[\Delta(Esp)= 2,17 \]

– Méthode 2 (budget total joué: 43,43%):

    \[\Delta(Esp)= 2,28 \]

Comme nous l’avions pressenti, la méthode 2 est donc la plus performante, en tout cas sur cet exemple.
L’espérance obtenue signifie que pour un 1€ misé, on peut espérer un gain net de 2,28€ environ (ou 2,25€ si on prend en compte les fractions correspondants aux mises arrondies).
En ayant joué une mise totale arrondie de 43€, l’espérance de gain net est donc ici de 97€ environ.
Il s’agit seulement d’un exemple théorique pour illustrer cette méthode, avec des probabilités attribuées de façon aléatoire.

Pour valider complètement cette méthode et les travaux de Kelly appliqués dans ce contexte, il faudra, comme pour toutes les stratégies de jeu, réaliser des backtests pour confronter cette méthode à la réalité.
Nous avons pour cela développé notre « Outil Kelly », qui intègre un algorithme basé sur la méthode 2.
Nous l’utiliserons donc pour les backtests de la formule de Kelly, qui eux-mêmes seront dépendants de la méthode choisie pour la définition des probabilités. En effet, même si cet outil fournit des résultats intéressants pour l’optimisation mathématique des paris, n’oublions pas que le challenge principal reste comme souvent l’estimation des probabilités.