Outil d’analyse de pronostics

Comme nous l’évoquons ici, la pertinence des pronostics est dans l’ensemble acceptable (même s’ils ne sont jamais aussi précis et réguliers que l’on le voudrait!), mais la pertinence d’un pronostiqueur doit être avant tout évaluée dans la durée, et au sein d’une stratégie de jeu, en prenant en compte notamment les types de paris joués et les types de courses sélectionnées.
Une fois ce périmètre défini il est nécessaire de pouvoir noter les pronostics selon une ou plusieurs méthodes, à utiliser systématiquement de la même façon, pour pouvoir comparer les pronostics sur une base égale.
C’est l’objet de notre outil d’analyse de pronostics, qui va suivre les étapes suivantes :

1/ Dans un premier temps il permet de sélectionner le périmètre d’analyse, en indiquant différents critères relatifs aux courses : période d’analyse, jour de la semaine, tranche horaire, hippodrome, discipline, type de course, fourchette de distance, fourchette de prix, fourchette d’âge, fourchette de gains, fourchette de nombre de partants, autostart, à réclamer, handicap, corde, sexe, terrain, rapports minimum pour chaque type de pari et chaque canal (online ou offline).

2/ Dans un deuxième temps il va sélectionner toutes les courses correspondant au périmètre choisi, importer les pronostics de l’ensemble des journaux de la base sur ce périmètre, puis va comparer l’arrivée avec le pronostic, afin de voir pour chaque cheval à l’arrivée si le journal l’avait pronostiqué, et si oui à quelle position

3/ L’outil va ensuite « noter» ces pronostics. A ce stade nous cherchons à noter l’exactitude du pronostic, indépendamment du gain qu’il engendre (notons cependant que comme les rapports font partie des variables du périmètre d’analyse, il est tout à fait possible d’analyser les pronostics uniquement sur les courses à fort rapport).
Comme différentes méthodes de notation sont possibles suivant ce que nous souhaitons analyser, nous utiliserons plusieurs méthodes et produirons plusieurs notes/scores. Par exemple pour le quinté, les scores suivants seront calculés:

o Score 1 « somme des différences de place »
Pour les 5 chevaux de l’arrivée on additionne la différence de place (en valeur absolue) entre la place pronostiquée (allant jusqu’à 8 puisque 8 chevaux pronostiqués) et la place réelle. Si le cheval n’a pas été pronostiqué la différence est de 10. On convertit ce résultat en pourcentage (note sur 1) par la formule score= 1- Somme différences/50.

o Score 2 « trouvés en 5 désordre »
Pour les 5 chevaux de l’arrivée on obtient 0,2 de score si le cheval a été trouvé dans les 5 premiers chevaux pronostiqués. On obtient ainsi un pourcentage reflétant l’aptitude à trouver l’arrivée dans le désordre avec les 5 premiers chevaux pronostiqués.

o Score 3 « trouvés en 6 désordre »
Pour les 5 chevaux de l’arrivée on obtient 0,2 de score si le cheval a été trouvé dans les 6 premiers chevaux pronostiqués. On obtient ainsi un pourcentage reflétant l’aptitude à trouver l’arrivée dans le désordre avec les 6 premiers chevaux pronostiqués.

o Score 4 « trouvés en 7 désordre »
Pour les 5 chevaux de l’arrivée on obtient 0,2 de score si le cheval a été trouvé dans les 7 premiers chevaux pronostiqués. On obtient ainsi un pourcentage reflétant l’aptitude à trouver l’arrivée dans le désordre avec les 7 premiers chevaux pronostiqués.

o Score 5 « trouvés en 8 désordre »
Pour les 5 chevaux de l’arrivée on obtient 0,2 de score si le cheval a été trouvé dans les 8 premiers chevaux pronostiqués. On obtient ainsi un pourcentage reflétant l’aptitude à trouver l’arrivée dans le désordre avec les 8 chevaux pronostiqués.

o Score 6 « ordre »
Pour les 5 chevaux de l’arrivée on obtient 0,2 de score si le cheval a été trouvé à la bonne place. On obtient ainsi un pourcentage reflétant l’aptitude à trouver l’arrivée dans l’ordre (forcément donc avec les 5 premiers chevaux pronostiqués)

o Score 7 « ordre avec bonus désordre en 5 »
Pour les 5 chevaux de l’arrivée on obtient 0,2 de score si le cheval a été trouvé à la bonne place, et 0,1 si il a été trouvé dans le désordre avec les 5 premiers chevaux pronostiqués. On obtient ainsi un pourcentage reflétant l’aptitude à trouver l’arrivée dans l’ordre mais en valorisant les chevaux trouvés dans le désordre avec les 5 premiers chevaux pronostiqués.

o Score 8 « ordre avec bonus désordre en 6 »
Pour les 5 chevaux de l’arrivée on obtient 0,2 de score si le cheval a été trouvé à la bonne place, et 0,1 si il a été trouvé dans le désordre avec les 6 premiers chevaux pronostiqués. On obtient ainsi un pourcentage reflétant l’aptitude à trouver l’arrivée dans l’ordre mais en valorisant les chevaux trouvés dans le désordre avec les 6 premiers chevaux pronostiqués.

o Score 9 « ordre avec bonus désordre en 7 »
Pour les 5 chevaux de l’arrivée on obtient 0,2 de score si le cheval a été trouvé à la bonne place, et 0,1 si il a été trouvé dans le désordre avec les 7 premiers chevaux pronostiqués. On obtient ainsi un pourcentage reflétant l’aptitude à trouver l’arrivée dans l’ordre mais en valorisant les chevaux trouvés dans le désordre avec les 7 premiers chevaux pronostiqués.

o Score 10 « ordre avec bonus désordre en 8 »
Pour les 5 chevaux de l’arrivée on obtient 0,2 de score si le cheval a été trouvé à la bonne place, et 0,1 si il a été trouvé dans le désordre avec les 8 chevaux pronostiqués. On obtient ainsi un pourcentage reflétant l’aptitude à trouver l’arrivée dans l’ordre mais en valorisant les chevaux trouvés dans le désordre avec les 8 chevaux pronostiqués.

4/ Pour chaque journal, on fait alors une moyenne de ces différents scores sur l’ensemble du périmètre de courses. Ces scores moyens vont ensuite être exportés dans une base spécifique, avec un identifiant/numéro d’analyse qui permet d’y associer le périmètre d’analyse. En comparant les scores sur un nombre important d’analyses, il sera ainsi possible de déterminer quels critères de courses rendent particulièrement performants certains pronostiqueurs. Pour connaître de façon générale les types de courses les mieux pronostiqués, on peut aussi calculer les meilleurs scores ou bien les scores moyens sur l’ensemble des journaux, et voir quelles analyses (et donc critères) obtiennent les meilleurs résultats.
Le nombre de courses faisant partie du périmètre sélectionné sera également stocké, afin de pouvoir évaluer sa représentativité.

5/ Les critères de course et leurs valeurs possibles étant nombreux, l’outil offre une fonctionnalité de génération d’analyse, permettant de générer à la volée plusieurs analyses, en faisant varier un ou plusieurs critères. Par exemple, on pourra demander à l’outil d’analyser les pronostics pour l’ensemble des hippodromes possibles (333 hippodromes internationaux en base), en lançant successivement l’analyse pour chacun d’entre eux.

6/ Afin de ne pas multiplier les analyses et de pouvoir rendre leur interprétation possible, on cherchera plutôt dans un premier temps à faire varier un seul critère. On retiendra la ou les valeurs pour lesquelles il offre les meilleurs scores, puis on pourra faire varier un 2ème critère, en ayant figé le premier à sa valeur optimale. Ainsi de suite, de proche en proche, on pourra ainsi évaluer comment certaines combinaisons de critères permettent d’améliorer les scores. In fine nous pourrons ainsi déterminer le périmètre ou critères précis de courses pour lesquels les pronostics sont les meilleurs, et avec quels journaux.

Nous présentons ici les résultats d’une analyse des pronostics des quintes par discipline, afin d’illustrer le fonctionnement de l’outil sur cet exemple.
MSim signifie meilleur score i moyen, avec les scores tels que définis ci-dessus.

DisciplineNb coursesMS1mMS2mMS3mMS4mMS5mMS6mMS7mMS8mMS9mMS10m
Trot Attelé6230,5880,5280,6040,680,7420,1470,3370,3750,4130,441
Haies980,5180,4630,5290,6140,6680,1290,2960,3290,3660,391
Steeple510,5130,4790,540,6230,670,1440,2950,3210,3560,388
Plat4700,4990,4360,510,5860,6530,0990,2680,3050,3430,376
Rapport Ta/Plat1,181,211,181,161,141,481,261,231,21,17

Nous observons que quel que soit le type de score qu’on choisit pour qu’on comparer les disciplines, le classement est le même (ce qui est compréhensible puisque par construction ceux-ci sont très corrélés) :
C’est le trot attelé qui est le mieux prédit au quinté, devant les haies, le steeple puis le plat (le cross trot et le trot monté ont un nombre de quintés trop faible dans notre base pour fournir des données représentatives, nous les éliminons donc de notre analyse).

On observe que le trot attelé est 1,14 à 1,48 fois mieux prédit que le plat par les pronostiqueurs, suivant le score que l’on étudie.
Si on vise l’ordre, le rapport est de 1,48.

Les pronostiqueurs prédisent mieux les courses de trot attelé que les courses de plat.
Il est nettement plus « facile » de trouver le quinté ordre au trot attelé qu’au plat, lorsqu’on parie en utilisant les pronostics.

Bien entendu, les rapports ne seront pas les mêmes non plus, comme nous pourrons le voir dans les backtests.

On peut ensuite s’amuser à regarder quel Journal a les meilleurs scores moyens, en triant nos données suivant le type de score qui nous intéresse.
On note dans le tableau ci-dessous Sim le Score i moyen de chaque journal.
Le score est en principe en pourcentage (donc sur 1), mais on ne notera ici que les chiffres après la virgule pour une meilleure lisibilité.
Les journaux sont ici anonymisés par souci de neutralité, numérotés par ordre décroissant du Score 1 moyen.

JournalNb coursesS1mS2mS3mS4mS5mS6mS7mS8mS9mS10m
Journal 1614588528604680737145337375413441
Journal 2582588527603673736138333371405437
Journal 3420583515602667742130322366398436
Journal 4582578508588665733131319360398432
Journal 5582576508596667732112310354390422
Journal 6582572505579650718147326363399432
Journal 7582570507582652720138323360395429
Journal 8582569509586659713135322361397424
Journal 9582569497578659726128312353393427
Journal 10582567501585654720130315357392425
Journal 11582562496575647711118307347382414
Journal 12582560500576650713120310348385416
Journal 13582560490569642711128309349385420
Journal 14582559489570645713123306346384418
Journal 15582559492574643710110301342376410
Journal 16582557482565642715118300341380416
Journal 17426557482567646711115298341380413
Journal 18582555494572639705109302341374407
Journal 19582553486564642708114300339378411
Journal 20582552495566637699130312348384415
Journal 21582552491569642702115303342379409
Journal 22582551493570641701117305344379409
Journal 23582546492564633698112302338373405
Journal 24582545481558631698118299338374408
Journal 25582545485557629692124304340376408
Journal 26582544489561628693115302338371404
Journal 27582543484557630692115299336373404
Journal 28582543476554633698118297336375408
Journal 29582540479555627690115297335371403
Journal 30582536478555623685108293332365396
Journal 31582535478548611685116297332364400
Journal 32582532466546613679114290330364397
Journal 33582528460529608689105283317357397

En analysant les écarts de valeurs, on constate que les meilleurs pronostiqueurs sont en moyenne 16,6% meilleurs que les moins bons. Selon le score étudié, ce pourcentage va de 9,3% (pour le score5, qui reflète l’aptitude à trouver l’arrivée dans le désordre avec 8 chevaux, pari le plus facile) à 40% (pour le score6, qui reflète l’aptitude à trouver l’arrivée dans l’ordre, pari le plus difficile)!

En fonction de votre stratégie de jeu (type de paris et type de courses à jouer, basés sur ces pronostics), cet outil vous permet donc de déterminer les meilleurs pronostiqueurs pour votre stratégie, et de quantifier leur taux de réussite.

Pour évaluer pleinement l’efficacité de votre stratégie, il faudra ensuite la backtester, ce qui permettra de déterminer les gains réels qu’elle engendrerait.
Pour aller plus loin nous vous invitons donc à lire les résultats de notre backtest de pronostics.