Outil d’analyse de modèles d’arrivée

Comme vous pouvez le voir dans les différentes analyses statiques présentées sur ce site, nous pouvons assez simplement évaluer l’influence d’un paramètre d’un cheval sur son pourcentage de victoires, de positions placées ou à l’arrivée.
Cette méthode s’avère suffisante pour les variables discrètes dont on peut faire l’analyse pour chaque valeur, mais moins adaptée pour les variables continues. C’est notamment le cas pour une des variables les plus importantes qu’est la cote du cheval, comme nous avons pu le voir ici: même en la transformant en rang ou en cote relative, l’analyse et la lecture sont assez difficiles.

Pour traiter ce type de cas, nous introduisons la notion de modèle d’arrivée, que nous définissons comme une chaîne de type X1-X2-X3-X4-X5 où Xi désigne, pour le cheval à la place i à l’arrivée, la valeur d’un critère X propre au cheval, et que l’on souhaite analyser (on se focalisera ici sur les courses avec 5 chevaux à l’arrivée).
Cela s’applique aux variables discrètes bien sûr (exemple pour la variable déferrage: une valeur de modèle d’arrivée peut être AP-P-AP-ND-A).
Mais également aux variables continues, en utilisant une bonne classification de ces variables.
La classification FOD présentée ici en est un bon exemple pour les cotes.

Les modèles d’arrivée permettent alors de visualiser les valeurs communes aux chevaux de l’arrivée, mais aussi de façon plus précise comment ces valeurs s’ordonnent entre elles pour aller du 1er au 5ème cheval de l’arrivée, et si certains modèles ressortent plus que d’autres.
On a alors une lecture uniformisée de l’arrivée, et pouvant donner une bonne idée de l’impact du critère X sur la performance des chevaux, surtout si le modèle d’arrivée dominant représente un pourcentage important du périmètre de courses analysé.

Pour analyser les modèles d’arrivée se dégageant sur un périmètre de courses donné, nous avons donc créé un outil d’analyse de modèles d’arrivée. Celui-ci va, dans l’ordre:

1/ Permettre à l’utilisateur de sélectionner le périmètre de courses à analyser en indiquant différents critères relatifs aux courses : période d’analyse, jour de la semaine, tranche horaire, hippodrome, discipline, type de course, fourchette de distance, fourchette de prix, fourchette d’âge, fourchette de gains, fourchette de nombre de partants, autostart, à réclamer, handicap, corde, sexe, terrain, rapports minimum et/ou maximum pour chaque type de pari et chaque canal (online ou offline).
2/ Importer les courses relatives à ces critères, ainsi que les variables propres au cheval et constituant le modèle d’arrivée à analyser (exemple: les cotes)
3/ Calculer pour chaque course le modèle d’arrivée qui s’applique, puis calculer sur l’ensemble du périmètre le pourcentage de cas où l’on retrouve ce modèle. On affichera alors le top 10 des modèles d’arrivée, classé par ordre décroissant du pourcentage du nombre de courses du périmètre analysé.
4/ Les critères de course et leurs valeurs possibles étant nombreux, l’outil offre une fonctionnalité de génération d’analyse, permettant de générer à la volée plusieurs analyses, en faisant varier un ou plusieurs critères. Par exemple, on pourra demander à l’outil d’analyser les modèles d’arrivée pour l’ensemble des hippodromes possibles (333 hippodromes internationaux en base), en lançant successivement l’analyse pour chacun d’entre eux.
5/ Chaque analyse comportant un nombre suffisant (fixé par défaut à 100) de courses analysées est exportée en base, de façon à pouvoir facilement comparer les analyses entre elles, et ne retenir que celles fournissant des modèles d’arrivée dominants significatifs.

Pour apprécier les résultats de cet outil sur le cas d’utilisation le plus utile qu’est l’analyse de l’influence des cotes, vous pouvez lire l’article Analyse de l’impact des cotes et de leur évolution par les modèles d’arrivées