Formule de Bayes - Paradoxe des tests de dépistage
Cette formule est souvent utilisée lorsque le système complet est constitué de $A$ et $\bar A$, un événement et son contraire. Dans ce cas, la formule se simplifie en : $$P_B(A)=\frac{P_A(B)P(A)}{P(B)}=\frac{P_A(B)P(A)}{P_A(B)P(A)+P_{\bar A}(B)P(\bar A)}.$$
Vous êtes directeur de cabinet du ministre de la santé. Une maladie est présente dans la population, dans la proportion d'une personne malade sur 10000. Un responsable d'un grand laboratoire pharmaceutique vient vous vanter son nouveau test de dépistage : si une personne est malade, le test est positif à 99%. Si une personne n'est pas malade, le test est positif à 0,1%.
Ces chiffres ont l'air excellent, vous ne pouvez qu'en convenir. Toutefois, avant d'autoriser la commercialisation de ce test, vous faites appel au statisticien du ministère : ce qui vous intéresse, ce n'est pas vraiment les résultats présentés par le laboratoire, c'est la probabilité qu'une personne soit malade si le test est positif. La formule de Bayes permet de calculer cette probabilité.
On note $M$ l'événement : "La personne est malade", et $T$ l'événement : "Le test est positif". Le but est de calculer $P_T(M)$. Les données que vous avez en main sont $P(M)=0,0001$ (et donc $P(\bar M)=0,9999$), $P_M(T)=0,99$ et $P_{\bar M}(T)=0,001$. La formule de Bayes donne : $$\begin{eqnarray*} P_T(M)&=&\frac{P_M(T)P(M)}{P_M(T)P(M)+P_{\bar M}(T)P(\bar M)}\\ &=&\frac{10^{-4}\times 0,99}{10^{-4}\times 0,99+0,9999\times 10^{-3}}\simeq 0,09. \end{eqnarray*} $$ C'est catastrophique! Il n'y a que 9% de chances qu'une personne positive au test soit effectivement malade! C'est tout le problème des tests de dépistage pour des maladies rares : ils doivent être excessivement performants, sous peine de donner beaucoup trop de "faux-positifs".