Vidéo de l'épisode Ziel mir keng!

« Ziel mir keng! » est diffusé sur RTL Tëlee après le « Wëssensmagazin Pisa ». Vous pouvez aussi visionner les épisodes sur RTL Play et sur la chaîne YouTube science.lu. https://www.youtube.com/user/scienceluxembourg.

Le Professeur Christophe Ley a procédé à l'examen par les pairs de cet article. 

Infobox

Christophe Ley- Biografie

Christophe Ley est professeur associé de statistique appliquée au département de mathématiques de l'Université du Luxembourg. Il est également président de la « European Association for Advanced Statistics Courses » et de la « Luxembourg Statistical Society », et fondateur du réseau international « Sports – Training and Research in Data Science Methods for Analytics and Injury Prevention Group ». Il est lauréat du prix Marie-Jeanne Laurent-Duhamel de la Société Française de Statistique et du prix international Bernoulli, ainsi que rédacteur adjoint de plusieurs revues spécialisées, dont « Annals of the Institute of Statistical Mathematics » et « Statistique et Société ».

 

Les médias nous inondent souvent de chiffres et de statistiques. 

À l'ère des fake news et des faits alternatifs, il est essentiel d'examiner de près les données et de les interpréter correctement. Les statistiques revêtent un rôle essentiel à cet égard. Elles permettent d'identifier des tendances et des schémas dans les données, et d'en tirer des conclusions ou de prendre des décisions. Mais des erreurs dans l'utilisation des statistiques – qu'elles soient intentionnelles ou non – surviennent régulièrement au quotidien.

Nous allons vous présenter cinq erreurs courantes d'interprétation des statistiques ainsi que la manière de les éviter.

Commençons par un classique : une corrélation n'implique pas nécessairement une causalité !

On parle de corrélation positive lorsque deux valeurs évoluent dans le même sens. Une corrélation négative se produit lorsque l'une des valeurs augmente, tandis que l'autre diminue.

On parle de causalité lorsqu'une valeur influence le comportement d'une autre, c'est-à-dire lorsqu'il existe une relation de cause à effet entre les deux. Par exemple : plus on boit d'alcool lors d'une soirée, plus on devient ivre.

La situation est différente dans l'exemple suivant : la ligne noire indique la consommation de beurre aux États-Unis et la ligne rouge représente le taux de divorce dans l'État américain du Maine. Les deux valeurs sont fortement corrélées, mais il n'y a pas de lien de causalité. Ce n'est pas parce que l'on consomme moins de beurre aux États-Unis qu'il y a moins de divorces dans le Maine.

Ce type d'erreur est malheureusement courant. Un titre peut par exemple annoncer :  « Une étude montre que boire beaucoup de vin rouge permet de vivre plus longtemps. » Mais cela ne signifie pas nécessairement qu'il existe un lien entre l'âge avancé et le vin rouge. Les personnes en question étaient peut-être plus actives sur les plans social et physique, et ont donc vécu plus longtemps.

D'où notre conseil : il faut toujours s'interroger si une corrélation reflète réellement une causalité.

 

Venons-en à la deuxième erreur : examiner une hausse en pourcentage sans tenir compte des valeurs absolues. 

Lorsqu'une entreprise annonce une hausse de 100 % de ses ventes par rapport au mois précédent, ce résultat semble remarquable. 

Mais si elle a vendu un seul article le mois précédent avec un chiffre d'affaires faible et deux le mois suivant, l'annonce d'une hausse de 100 % est bien correcte, mais peu impressionnante. Il en va différemment lorsqu'une entreprise vend des millions d'articles par an avec un chiffre d'affaires très élevé. Dans ce cas, une augmentation des ventes de quelques pour cent est bien plus significative qu'avec des chiffres absolus peu élevés.

Prenons à présent l'exemple de salaires fictifs de cadres et de salariés dans une entreprise. La direction affirme que les salariés se sont vu octroyer une hausse plus importante : 10 %. Les cadres, eux, n'ont bénéficié que d'une hausse de 5 %. Ce graphique illustre ces données correctement.

Mais il ne faut pas pour autant en conclure que les salariés ont reçu plus d'argent que les cadres.

Imaginons par exemple que le salaire des salariés était initialement de 2 000 euros et celui des cadres de 6 000 euros. Les salariés ont certes reçu une augmentation plus importante en pourcentage, mais en termes absolus, ce sont les cadres qui ont mieux tiré leur épingle du jeu. Ils ont reçu 100 euros de plus que les salariés.

Notre conseil : lorsqu'il s'agit d'une hausse en pourcentage, il faut aussi tenir compte des valeurs absolues.

 

Troisième erreur : ne pas examiner attentivement les axes des diagrammes et graphiques.

Prenons un exemple fictif de résultats électoraux d'un parti, comparé aux élections précédentes. Le parti affirme avoir gagné un très grand nombre de voix. Le graphique semble refléter cette information. Toutefois, en y regardant de plus près, on constate un effet de zoom. En examinant le graphique dans sa totalité, on s’aperçoit que la différence est très faible.

Les graphiques peuvent aussi être resserrés ou étirés pour accentuer ou atténuer les différences.

Notre conseil : il faut toujours vérifier l'étiquette des axes et l'échelle utilisée.  
 

Venons-en à la quatrième erreur : ne pas reconnaître le paradoxe de Simpson.    

Prenons de nouveau comme exemple une entreprise fictive. Les hommes y gagnent en moyenne plus que les femmes. Mais si l'on analyse les différentes catégories au sein de cette entreprise, par exemple, la direction, le management intermédiaire et les assistants, on constate que, dans chacune de ces catégories, les femmes gagnent plus que les hommes.

Comment est-ce possible ? Dans le cas de cette entreprise, cette situation s'explique par le fait que, même si les femmes gagnent plus dans chaque catégorie, elles sont globalement plus nombreuses dans les postes d'assistantes moins bien rémunérés et moins représentées dans la direction. Sans la deuxième information, on pourrait penser à tort que les hommes gagnent plus pour le même travail.

Une analyse plus détaillée montre que c'est le contraire et que le problème tient au fait que les hommes occupent des postes plus élevés dans cette entreprise.

Notre conseil :  face à des moyennes, vérifiez toujours si les sous-catégories présentent des résultats différents.   

 

Venons-en à la dernière erreur : la médiane est parfois plus parlante que la moyenne. 

Prenons l'exemple d'un petit hameau de 100 habitants. En moyenne, les habitants disposent d'un patrimoine de 100 000 euros par personne.

Un milliardaire avec un patrimoine de 3 milliards d'euros vient alors s'installer dans ce hameau. Le hameau compte désormais 101 habitants avec un patrimoine moyen de 29,8 millions d'euros. Les autres habitants ne se sont bien sûr pas enrichis du jour au lendemain. Mais la moyenne n'est pas une mesure très pertinente en présence de valeurs extrêmes, surtout dans de petites populations. 

Dans ce cas, il serait préférable d'utiliser la médiane. La médiane est la valeur qui se situe exactement au milieu d'un jeu de données. Dans cet exemple, la médiane correspond à un niveau de richesse tel qu'une moitié de la population se situe en dessous et l'autre au-dessus. La médiane varie très peu à l'arrivée d'un seul nouvel habitant, peu importe son revenu, ce qui reflète bien mieux la réalité des autres habitants du hameau.  

Conclusion :  les statistiques sont très utiles. Elles permettent de mieux analyser et contextualiser les données pour éviter de fonder des décisions importantes sur l'intuition.

Pour éviter les erreurs, il faut souvent disposer de connaissances contextuelles et comprendre ce que les statistiques montrent et ce qu'elles ne montrent pas.

Soyez donc vigilants et faites preuve d'esprit critique. 

 

Auteur : Jean-Paul Bertemes (FNR)
Examen par les pairs : Professeur Christophe Ley (Université du Luxembourg, GrewIA)
Rédaction : Lucie Zeches (FNR)

Graphiques : George Dos Santos R., Antone Stepine (Headroom)
Réalisation et montage : Dominique Weber (SKIN)
Caméra : Océane Maître (SKIN)
Éclairage : Dave Schmit (SKIN)
Traduction : Nadia Taouil (www.t9n.lu)

Aussi dans cette rubrique

Nutrition La nouvelle pyramide alimentaire américaine – le monde à l’envers ?

Les États-Unis renversent leur pyramide alimentaire. Le nutritionniste Prof. Torsten Bohn du LIH analyse ce qui a changé — et explique pourquoi les protéines sont actuellement au cœur de l’attention.

LIH, FNR
Brûlures et intoxications par les fumées Pourquoi les brûlures sont-elles si difficiles à traiter ?

La peau est notre plus grand organe. Que faut-il faire si l’on subit soi-même des brûlures ou si quelqu’un d’autre en est victime ? Et pourquoi le traitement des brûlures est-il si long et complexe ?

FNR
Ziel mir keng! – Science Check Qu'est-ce que l'autisme et le nombre de cas diagnostiqués est-il en hausse ?

Qu'est-ce que l'autisme au juste ? Comment le diagnostique-t-on ? Et pourquoi le nombre de cas est-il en hausse ?