Tuesday, June 23, 2020

Les cibles ratées pour les femmes : La saison dans son totalité

La semaine dernière, nous avons demandé si les biathletes sont ébranlés quand ils ratent leurs cibles. On a discuter un peu ce qui doit être anticipé au cas où les tirs sont vraiment indépendants les uns des autres. Enfin, on a vu en quoi une telle distribution consisterait. 

Aujourd'hui, on examinera les données, afin d'avoir une discussion basée sur les faits. On pourrait regarder  les données avec trois verres différents. 
  1. On pourrait considerer la saison dans sa totalité, avec toutes les biathletes regroupées dans une même classe.
  2. On pourrait considerer chaque événement séparément, mais avec les biathletes pour cet événement groupées ensemble.
  3. On pourrait considerer les biathletes—soit individuellement, soit par tranche de réussite—pendant toute la saison.
En chaque cas, on considéra les hypothèses suivantes:
  • H0 : Les coups dans un même tir sont indépendants, c'est-à-dire que chaque coup a la même probabilité de trouver sa cible.
  • Ha : Les coups dans un même tir ne sont pas indépendants.
On cherche d'évidence pour rejeter H0, c'est-à-dire, pour disant que l'on ne croit pas que les coups aient la même probabilité d'atteindre sa cible. (Pour cet exercice, on demandera un p-value en dessous de 0.05 pour rejeter H0, ce qui correspond avec une certitude d'environ 95%.)

En commençant avec le premier verre, on peut calculer que les taux de réussite chez les femmes sont 0.823 (82.3%) pour les tirs couchés et 0.767 (76.7%) pour les tirs debout. On peut alors faire de prédictions pour les tirs, puis les comparer au résultats observés.

 Tirs couchés 0 cibles
 ratées
 1 cible
 ratée
 2 cibles
ratées
 3 cibles ratées 4 cibles ratées 5 cibles ratées
 Observé (couché) 919 787 355 104 36 2
 Prévu (couché) 830 895 386 83 9 0


 Tirs debout
 0 cibles
 ratées
 1 cible
 ratée
 2 cibles 
ratées
 3 cibles ratées 4 cibles ratées 5 cibles ratées
 Observé (debout) 624 823 551 167 35 4
 Prévu (debout) 586 889 539 164 251

Graphiquement, on a le suivant pour les tirs couchées


et celui-ci pour les tirs debout. 


On peut noter que, dans les deux cas, on trouve plus de tirs parfait qu'attendu, et que l'on observe moins de tirs avec un seule cible ratée. Cela suggère que, au moins ici, les coups d'un tir ne sont pas indépendants. On peut utiliser un chi-squared goodness of fit test afin de déterminer la probabilité que les coups soient indépendants. Dans le cas de tirs couchés, on obtient le valeur p = 6.38 e-24, qui est beaucoup plus petit que 0.05. Alors on peut rejeter H0 pour les tirs couchés. Dans le cas de tirs debout, on trouve le valuer p = 0.007, qui est plus grand, mais qui reste plus petit que 0.05. Alors on peut aussi rejeter H0 pour les tirs debout.

Alors, c'est fait, non? Les coups d'un tir ne sont pas indépendants, parce qu'on a trouvé des valeurs de p bien en-dessous de 0.05. Mais peut être il y a une autre explication, pour exemple, peut être la variation dans la tir vient des variations entre les épreuves? Pour cela, il serait utile de considerer le deuxième verre.

Tuesday, June 16, 2020

Les biathletes sont-ils ébranlés quand ils ratent leur cibles ?

Cette semaine je voudrais discuter le tir, et plus particulièrement la question : Les biathletes sont-ils ébranlés quand ils ratent leur cibles ? Aujourd'hui, je discuterai un peu la théorie, puis, vendredi prochain, on regardera les données, et on verra si l'on peut tirer des conclusions.

Supposons que l'on considère une biathlete qui tire à 80%, et supposons qu'elle ne s'énerve pas quand elle rate sa cible. Alors,  à chaque passage au tir, elle va avoir un 4 sur 5, n'est-ce pas? Si vous avez regardé un peu de biathlon, vous savez déjà que ce n'est pas le cas, donc il faut un peu plus d'analyse (et un mini-cours en probabilité).

Si notre biathlete tire à 80% (débout, bien sûr), cela va dire que, pour chaque tir, elle a une chance de 4 sur 5 de réussir, et une chance de 1 sur 5 de rater sa cible. Et si elle ne s'énerve pas, on pourrait imaginer que cette probabilité doit être le même pour chaque tir, sans consideration de réussite ou non du tir précédent. On peut alors calculer la probabilité de chaque résultat possible pendant un passage au tir.

Par exemple, pour arriver à 3 sur 5, on a le calcul suivant:
  • Premièrement, il faut determiner le nombre de façons d'arriver à 3 réussites sur 5 tirs. Notre biathlete peut rater ses 2 premières balles, ou la première puis la troisième, ou la première puis la quatrième, etc. En total, il existe 10 possibilités (1-2, 1-3, 1-4, 1-5, 2-3, 2-4, 2-5, 3-4, 3-5, et 4-5).
  • Deuxièmement, il faut calculer la probabilité qu'elle rate les deux premières cibles. On aurait
            (0,2) X (0,2) X (0,8) X (0,8) X (0,8) = 0,02048
  • Et enfin, il faut les multiplier pour trouver la probabilité qu'elle aurait un 3 sur 5.
(10 possibilités) X (0,02048 probabilité pour chacune) = 0, 2048 = 20,48%

Et on pourrait imaginer de faire le même exercice pour les autres résultats, ou pour des autres pourcentages. Si on le fait, on trouverait la table suivante:

  Tir à 75%   Tir à 80% Tir à 85%Tir à 90% Tir à 95%
 5 sur 5
23,7 %32,8 % 44,4 % 59,0 %  77,4 %
 4 sur 5 39,6 %41,0 % 39,2 % 32,8 % 20,4 % 
 3 sur 5 26,4 %20,5 % 13,8 % 7,3 % 2,1 % 
 2 sur 5 8,8 %5,1 % 2,4 %  0,8 % 0,1 %
 1 sur 5 1,5 % 0,6 %0,2% 0 % 0 % 
 0 sur 5 0,1% 0 % 0 % 0 % 0 %

 Alors, on pourrait imaginer qu'une biathlete qui a tiré à 80% la saison précédente devrait avoir environ:
  • (0, 328 chance d'avoir un 5 sur 5) X (66 passages à tir) = 22 passages à tir avec un 5 sur 5
  • (0, 410 chance d'avoir un 4 sur 5) X (66 passages à tir) = 27 passages à tir avec un 4 sur 5
  • (0, 205 chance d'avoir un 3 sur 5) X (66 passages à tir) = 14 passages à tir avec un 3 sur 5
  • (0, 051 chance d'avoir un 2 sur 5) X (66 passages à tir) = 3 passages à tir avec un 2 sur 5
  • (0, 006 chance d'avoir un 1 sur 5) X (66 passages à tir) = 0 passages à tir avec un 1 sur 5
  • (0, 0 chance d'avoir un 0 sur 5) X (66 passages à tir) = 0 passages à tir avec un 0 sur 5
Maintenant, on supposons qu'elle a eu 40 passages au tir avec un 5 sur 5, mais seulement 4 passages avec un 4 sur 5. On pourrait penser que, si elle rate une cible, elle aurait beaucoup plus de probabilité de rater la prochaine cible. On pourrait également penser qu'il y a peut-être des problèmes de météo, d'équipement, ou d'épuisement... 

On explorera tout ça vendredi....

À bientôt!