Vous êtes ici

Pour un usage lucide des statistiques

Par Marina Julienne le jeu 10/3/11 - 23:13

Une formation organisée par la Société française des statistiques.

La place rouge était vide,
Devant moi marchait Nathalie,
Il avait un joli nom, mon guide
Nathalie...

Rien de tel qu'un bon tube de Gilbert Bécaud pour vous donner envie de suivre une formation aux statistiques ! C'est ainsi que Claudine Schwartz, mathématicienne et responsable du site Statistix* a démarré son exposé. En 1966, 31 421 bébés ont été nommés Nathalie, contre moins de 400 par an avant 1955 (retrouvez la courbe sur : http://www.aufeminin.com/w/prenom/p14490/nathalie.html). La faute à la chanson de notre Gilbert national, diffusée en 1964 ? ( allez donc vous régaler en images et en sons sur http://www.dailymotion.com/video/x1gdbp_gilbert-becaud-nathalie_music). On pourrait le croire en voyant la belle courbe en cloche formée par la popularité de ce prénom, qui démarre en flèche après la diffusion de « Nathalie » sur les radios. Et bien non, nous ne sommes pas là devant une cause mais devant un magnifique exemple d'une « boucle de rétroaction ». Car en fait la vogue du prénom Nathalie démarre, si on regarde à la loupe le graphique, un peu avant 1964, la chanson de Gilbert Bécaud venant amplifier un phénomène de mode pré-existant (et peut être dû à la sortie de West Side story, en 1961, avec Nathalie (oui !) Wood dans le rôle de Maria, l'amoureuse de Tony) . Cet exemple illustre aussi la différence entre la preuve mathématique et la preuve statistique, cette dernière comportant toujours un élément d'incertitude : dans le cas précis, on ne peut même pas être certain que ce soit Nathalie Wood qui soit à l'origine de la vogue du prénom Nathalie...

Autre notion essentielle à retenir de l'exposé de Claudine Schwartz : la différence entre la moyenne et la médiane : tous deux sont des indicateurs de position, qui permettent d'avoir une idée du « centre » de la série Mais n'allez pas les confondre !! La médiane est la valeur centrale de la série, elle la partage en deux moitiés tandis que la moyenne correspond à la somme des valeurs divisée par le nombre de valeurs. Ainsi, si les valeurs extrêmes d'une série changent, cela n'aura aucune incidence sur la médiane mais cela aura une incidence sur la moyenne. Vous n'avez pas suivi ? Alors prenez un exemple simple, celui des salaires : la médiane est généralement plus représentative pour l'analyse des petits groupes, car la présence de quelques cas extrêmes peut tirer fortement la moyenne vers le haut ou vers le bas Pour un groupe de 10 salaires, dont 8 de 5'000 euros et 2 de 10'000 euros. La moyenne est 6'000 et la médiane de 5'000. La moyenne est tirée fortement vers le haut, dans une zone où il n'y a justement pas de salaires. La médiane est en revanche représentative de la majorité des salaires analysés.

Puis Pierre-Yves Boelle, chercheur à l'Inserm (Epidémiologie des maladies infectieuses et modélisation) nous a ensuite parlé de toutes les notions importantes à connaître quand on s'intéresse aux épidémies : taux d'attaque, prévalence, incidence, ratio de reproduction, cas index, etc. Et nous a pointé la différence, du simple au double (!), d'évaluation du nombre de cas de grippe A l'an dernier entre les données des Grog (groupes régionaux d'observation de la grippe) et celles du réseau Sentinelles. N'hésitez pas à l'appeler pour la prochaine épidémie de... H2N3 ??

Nous avons enchaîné, l'après midi, avec un exposé passionnant de Jean-François Royer, inspecteur général honoraire de l'INSEE, sur les mesures de la pauvreté, où l'on a reparlé de la distinction entre médiane et moyenne, et constaté que ce que qu'on appelle communément l'indice de pauvreté mesure en fait l'évolution de l'inégalité des revenus.

Et nous avons terminé la journée avec un exposé de René Padieu, inspecteur général honoraire de l'INSEE également, sur la mesure des chiffres de la délinquance : que recouvrent-ils exactement (par exemple ni la délinquance routière ni les délits fiscaux ne sont comptabilisés dans les données médiatisées par le ministère de l'intérieur), Que sont les enquêtes de victimation de l'Insee ? René Padieu nous a également pointé quelques pièges dans lesquels les journalistes sautent à pieds joints, comme cette étude qui annonçait que 25% (attention, chiffre cité de mémoire, à vérifier !) des femmes en France étaient victimes de harcèlement (contre 1 à 5% dans les autres pays d'Europe) ce qui avait fait la Une du journal de 20 heures, et un article dans un « grand journal du soir » mais qui s'est révélé en fait être le résultat d'une erreur de calcul informatique...

Vous voilà prévenus, gare aux chiffres !

Et en prime les TROIS sites (et il y aurait beaucoup à dire sur l'abus du chiffre 3 par les journalistes, à commencer par le fameux « 3 questions à ») grâce auxquels vous n'écrirez plus ou ne direz plus n'importe quoi :

  • Le site très complet et documenté de la Sfds : http://www.sfds.asso.fr/
  • L'excellent site de l'association Pénombre, espace de réflexions et d'échanges sur l'usage du nombre dans le débat public, qui pointe la qualité des informations chiffrées et les enjeux de l'usage qui en est fait : http://www.penombre.org/
  • Le centre de ressources pour l'enseignement de la statistique :www.statistix.fr

Pour les joindre :

Pour un usage lucide des statistiques

Mardi 19 Octobre 2010
10:00 - 16:00
Institut Henri Poincaré 75006 Paris