Profession: traqueur de connaissance

couv

L’Institut de recherche en statistique de l’UNIGE s’est joint à quelque 2000 organismes pour faire de 2013 la première Année internationale de la statistique et souligner ainsi l’importance de ce domaine dans tous les secteurs de la société

Statisticien est le métier le plus sexy de la décennie. Ce n’est pas la directrice de l’Institut de statistique de l’UNIGE qui le dit, mais Hal Varian, «chief economist» chez Google. Qui d’autre qu’un statisticien pour faire parler les chiffres et rendre intelligible la masse d’information environnante? La quantité exponentielle de données stockées dans les serveurs du monde entier constitue en effet une véritable mine d’or pour les entreprises, les institutions publiques et les chercheurs. Mais elle demeure largement sous-exploitée. Car une denrée a proportionnellement tendance à se raréfier: le savoir-faire des statisticiens, les plus aptes à distinguer les signaux pertinents dans le bruit généré par ces zetta­octets d’information.

C’est en partie ce qui a incité plusieurs centaines d’organisations à faire de 2013 la première Année internationale de la statistique. L’occasion pour elles de souligner l’importance grandissante de ce domaine dans la société, que ce soit pour promouvoir la croissance économique, améliorer les services publics ou pour améliorer nos connaissances sur le fonctionnement du cerveau, le développement des maladies, les comportements humains, l’évolution des écosystèmes et des flux financiers...

Un îlot de stabilité
Si la statistique est aujourd’hui partout présente, les statisticiens font rarement la Une des journaux et ne peuvent guère tabler sur des découvertes spectaculaires pour capter l’attention des médias et du public. Et pour cause: leur travail consiste essentiellement à se mettre au service des autres acteurs du monde scientifique. «C’est aussi la beauté de notre métier, précise la professeure Maria-Pia Victoria-Feser, directrice de l’Institut de recherche en statistique de l’UNIGE (Faculté des SES). Nous sommes constamment en lien avec des chercheurs d’autres disciplines, ce qui nous permet de développer une connaissance, certes superficielle, mais passionnante dans une foule de domaines.»

Les statisticiens sont tenus d’adapter leurs outils aux besoins de leurs collègues scientifiques. Toutefois, les méthodes fondamentales auxquelles ils ont recours, ancrées dans la réalité mathématique, constituent un îlot de stabilité. «Je crois aux fondamentaux, insiste Maria-Pia Victoria-Feser. Il y a toujours de nouveaux défis à relever. Actuellement c’est le Data Science, l’analyse des grandes bases de données générées par les technologies de l’information. Mais la statistique fondamentale est intemporelle.»

Quels sont ces fondamentaux? Pour résumer, la principale mission des statisticiens consiste à faire la part des choses entre la connaissance contenue dans les données, et le bruit qui l’entoure, en développant des méthodes susceptibles de le quantifier.

Maîtriser l'erreur
Ainsi les méthodes statistiques mettent en évidence de la connaissance avec une certaine «marge d’erreur». N’importe quelle étude en sciences expérimentales fonctionne en effet sur la base d’échantillons, l’accès à l’information totale étant par principe illusoire. Les chercheurs sont par conséquent condamnés à extrapoler, en limitant au maximum la marge d’erreur induite par cette démarche, s’ils veulent produire une description valable pour toute une population.

Les statisticiens considèrent généralement qu’une information est significative, lorsqu’il est possible de l’extrapoler avec une marge d’erreur se situant en-dessous de la barre des 5%, sa grandeur précise étant déterminée en fonction du domaine, du problème et des données.

Traqueurs de connaissances, les statisticiens s’efforcent aussi de rendre leurs collègues chercheurs attentifs à des résultats trompeurs. «Une marge d’erreur de 5% est relativement faible, explique Maria-Pia Victoria-Feser. Mais si on la cumule en répétant l’analyse, la possibilité de produire un résultat erroné grimpe rapidement.»

Saumon mort-vivant
Des chercheurs américains se sont ainsi amusés à fournir la «preuve» d’une activité cérébrale chez un saumon mort depuis plusieurs heures, en employant la méthode statistique standard utilisée en neurosciences. Un résultat pour le moins surprenant qui s’explique par le fait que cette approche standard est mal adaptée à la mesure de l’activité cérébrale. Elle contient forcément une marge d’erreur qui, si elle est cumulée sur une grande quantité de tests, augmente fortement la probabilité d’obtenir un résultat absurde.

Autre exemple d’erreurs fréquentes, celles liées au conditionnement des données: en ne tenant compte – volontairement ou non – que d’un seul paramètre dans une analyse, laissant de côté d’autres aspects signifiants, il est possible de décrire un phénomène de cause à effet là où il n’existe qu’une corrélation.

Un chercheur de l’Université Columbia a ainsi établi un lien entre la consommation de chocolat et les capacités cognitives d’une population mesurées au nombre de ses Prix Nobel: plus on mange de chocolat, plus on produit de Prix Nobel. Cause à effet ou simple corrélation?

Selon Maria-Pia Victoria-Feser, nombre d’erreurs scientifiques involontaires pourraient être évitées en s’assurant les services d’un statisticien. «Les universités, du moins en Europe, sont sous-dotées sur ce plan, dans nombre de domaines qui recourent à la statistique comme la médecine ou la biologie.» Raison pour laquelle l’Institut de recherche en statistique a dégagé des ressources pour offrir à la communauté universitaire un service de consultation


Articles associés

La "science des données", nouveau défi statistique
L'Institut qui dompte les statistiques

Vidéo

Web TV SES: A Day without Statistics