guess the correlationGuess the correlation (Browser)
Omar Wagih

 

Quel est le lien entre le budget scientifique des États-Unis et les suicides par pendaison ? Le nombre de noyades dans des piscines et celui des films de Nicolas Cage ? Le taux de divorce dans le Maine et la consommation de margarine ? Rien. Ou si : une corrélation, soit pas beaucoup plus.

 

Bien pratique pour exprimer les liens de cause à effet entre deux statistiques, le coefficient de corrélation linéaire est très souvent trompeur, que ce soit en raison de simples coïncidences comme vu plus haut, ou d’une troisième variable oubliée de l’équation : si l’augmentation du vote conservateur et la vente de dentiers sont corrélées en région PACA, ce n’est pas que Christian Estrosi et Marion Maréchal Nous Voilà Le Pen font tomber les dents, ni que les édentés n’ont jamais pardonné au président (soi-disant) socialiste ses moqueries à leur sujet, mais peut-être en raison d’un vieillissement de la population. Guess the correlation ne cherche pas à nous apprendre à nous méfier des corrélations (ça c’était cadeau), mais à les reconnaître et à les évaluer à vue de nez.

 

À partir d’un nuage de points sur un repaire orthonormé, nous serons invités à deviner le coefficient de corrélation linéaire qui existe entre les deux variables. 0 il n’existe aucune corrélation et les points sont éparpillés sur le repère, 1, la corrélation est maximale, et les points forment une ligne (Omar Wahig nous épargne les coefficients négatifs).

 

En plus de parvenir à rendre amusant un exercice qui ne l’est pas forcément, Guess the correlation œuvre pour la science. Toutes nos réponses sont en effet collectées anonymement pour évaluer la perception que l’œil et le cerveau humain ont des corrélations. Ce que le jeu révèle de mon côté, c’est que si les extrêmes (0,1/0,2/0,8/0,9) sont faciles à deviner correctement, il n’en va pas de même pour toutes les valeurs intermédiaires, où je me plante fréquemment de plus de 0,2. Comme l’auteur, je suis curieux de savoir ce qu’il en est des autres et attends déjà avec impatience les résultats de cette étude pour voir à quelles statistiques le taux de bonne réponse peut bien être corrélé.

 

Merci à Kitai pour la suggestion