Valeur $p$ (ou $p$-value)
Dans un test statistique, la valeur $p$ (ou $p$-value, le terme anglais étant aussi utilisé dans la littérature francophone) est la probabilité, pour un modèle statistique donné, sous l'hypothèse nulle, d'obtenir au moins une valeur aussi extrême que celle observée. Suivant la nature du test, la valeur $p$ se calcule de trois façons différentes :
- pour un test unilatéral à droite, si $X$ est la variable aléatoire que devrait suivre la quantité observée sous l'hypothèse nulle, et si $x_0$ est la valeur observée, alors la valeur $p$ est par définition $P(X\geq x_0).$
- pour un test unilatéral à gauche, si $X$ est la variable aléatoire que devrait suivre la quantité observée sous l'hypothèse nulle, et si $x_0$ est la valeur observée, alors la valeur $p$ est par définition $P(X\leq x_0).$
- pour un test bilatéral, si $X$ est la variable aléatoire que devrait suivre la quantité observée sous l'hypothèse nulle, et si $x_0$ est la valeur observée, alors la valeur $p$ est par définition $2\min(P(X\geq x_0),P(X\leq x_0)).$
La valeur $p$ sert à l'aide à la décision : on compare $p$ à un seuil préalablement fixé (par exemple, $5\%$). Si la valeur $p$ est inférieure à ce seuil, on rejette l'hypothèse nulle, et on déclare le résultat du test "statistiquement significatif". Ceci ne signifie pas que l'hypothèse nulle est fausse, mais qu'il y a de bonnes raisons de croire qu'elle l'est. En général, on utilise les seuls suivants :
- $p \geq 0,\!05$ : l'écart par rapport au modèle n'est pas significatif, on ne peut rien conclure.
- $0,\!01 \leq p < 0,\!05$ : l'écart est faiblement significatif.
- $0,\!005 \leq p < 0,\!01$ : l'écart est significatif.
- $p < 0,\!005$ : l'écart est fortement significatif.
L'usage de la valeur $p$ a été fortement critiqué pour l'interprétation qui en est parfois fait. L'utilisation du seuil peut être vue comme arbitraire, et la connaissance de la valeur $p$ donne beaucoup plus d'informations que la seule information l'écart est (ou n'est pas) statistiquement significatif.