1 juin 2016

Une déclaration de l’American Statistical Association sur la valeur-p et la signification statistique.

Brèves d'actualité

La valeur-p (en anglais p-value) est une statistique communément utilisée dans une multitude de domaines scientifiques, notamment en santé environnementale et en santé publique, afin d’identifier des différences de moyenne statistiquement significatives entre deux ou plusieurs groupes. Celle-ci se définit comme la probabilité d’obtenir un résultat aussi ou plus extrême que celui observé si l’hypothèse nulle est vraie.

Le débat autour de l’utilisation de la valeur-p n’est pas nouveau. La valeur-p, qui est le « gold standard » de la validité statistique, n’est pas aussi fiable que de nombreux scientifiques le croient pour conclure ou non à un réel résultat significatif et, déjà dans le passé, d’autres ont tenté de décourager son utilisation ou, à tout le moins, d’alerter quant aux dangers de sa mauvaise utilisation, pouvant mener à des conclusions et des décisions erronées.

La valeur-p de 0,05, communément établie comme standard, est arbitraire. Pourtant, une valeur-p légèrement plus grande ou plus petite que 0,05 peut s’avérer la différence entre un article publié dans un certain journal ou non, ou encore, pour d’autres, peut signifier la présence d’un effet néfaste ou non sur la santé d’un quelconque contaminant. Qui plus est, plusieurs pensent, à tort, qu’une valeur-p de 0,05 signifie qu’il y a une probabilité de 95 % qu’une hypothèse donnée soit correcte.

Visiblement préoccupé par la mauvaise application et interprétation grandissante de la valeur-p et son utilisation abusive, la renommée American Statistical Association (ASA) a pris l’initiative inhabituelle de publier, en date du 7 mars 2016, une déclaration sur la valeur-p et la signification statistique. Il s’agissait de la première fois en 177 ans que l’ASA émet des recommandations explicites sur une question fondamentale de statistique. Dans sa déclaration, l’ASA énonce notamment les six principes suivants pour guider l’utilisation et l’interprétation de la valeur-p :

  1. La valeur-p peut être utile pour indiquer l’incompatibilité entre les données et un modèle statistique spécifié;
  2. La valeur-p ne mesure pas la probabilité que l’hypothèse étudiée soit vraie, ou la probabilité que les données aient été produites par le hasard seul;
  3. Les conclusions scientifiques ne devraient pas être fondées que sur le fait que la valeur-p se trouve au-delà ou non d’une valeur seuil;
  4. Afin d’être appropriée, l’inférence requiert que les résultats soient rapportés de façon complète et transparente (c’est-à-dire, ne pas rapporter seulement les résultats statistiquement significatifs);
  5. La valeur-p, ou la signification statistique, ne mesurent pas la taille d’un effet ou l’importance d’un résultat;
  6. En soi, la valeur-p ne fournit pas une bonne mesure de la preuve concernant un modèle ou hypothèse.

La déclaration de l’ASA comporte un court paragraphe élaborant sur chacun des principes ci-haut. Une compréhension de ces principes est essentielle afin de pouvoir adéquatement interpréter les évidences de la littérature scientifique et orienter la prise de décision en santé publique.

Collaboration spéciale : Stéphane Buteau, conseiller scientifique, Direction de la santé environnementale et de la toxicologie, Institut national de santé publique du Québec.

Source :

Ronald L. Wasserstein & Nicole A. Lazar (2016) : The ASA’s statement on p-values : context, process, and purpose, The American Statistician, DOI:10.1080/00031305.2016.1154108.