$$\newcommand{\mtn}{\mathbb{N}}\newcommand{\mtns}{\mathbb{N}^*}\newcommand{\mtz}{\mathbb{Z}}\newcommand{\mtr}{\mathbb{R}}\newcommand{\mtk}{\mathbb{K}}\newcommand{\mtq}{\mathbb{Q}}\newcommand{\mtc}{\mathbb{C}}\newcommand{\mch}{\mathcal{H}}\newcommand{\mcp}{\mathcal{P}}\newcommand{\mcb}{\mathcal{B}}\newcommand{\mcl}{\mathcal{L}} \newcommand{\mcm}{\mathcal{M}}\newcommand{\mcc}{\mathcal{C}} \newcommand{\mcmn}{\mathcal{M}}\newcommand{\mcmnr}{\mathcal{M}_n(\mtr)} \newcommand{\mcmnk}{\mathcal{M}_n(\mtk)}\newcommand{\mcsn}{\mathcal{S}_n} \newcommand{\mcs}{\mathcal{S}}\newcommand{\mcd}{\mathcal{D}} \newcommand{\mcsns}{\mathcal{S}_n^{++}}\newcommand{\glnk}{GL_n(\mtk)} \newcommand{\mnr}{\mathcal{M}_n(\mtr)}\DeclareMathOperator{\ch}{ch} \DeclareMathOperator{\sh}{sh}\DeclareMathOperator{\th}{th} \DeclareMathOperator{\vect}{vect}\DeclareMathOperator{\card}{card} \DeclareMathOperator{\comat}{comat}\DeclareMathOperator{\imv}{Im} \DeclareMathOperator{\rang}{rg}\DeclareMathOperator{\Fr}{Fr} \DeclareMathOperator{\diam}{diam}\DeclareMathOperator{\supp}{supp} \newcommand{\veps}{\varepsilon}\newcommand{\mcu}{\mathcal{U}} \newcommand{\mcun}{\mcu_n}\newcommand{\dis}{\displaystyle} \newcommand{\croouv}{[\![}\newcommand{\crofer}{]\!]} \newcommand{\rab}{\mathcal{R}(a,b)}\newcommand{\pss}[2]{\langle #1,#2\rangle} $$
Bibm@th

Sondages et intervalles de confiance

À chaque élection, c'est le même rituel. On nous assène que tel candidat fera 23,4% des voix. Puis, le lendemain, seulement 19,6%. Pourquoi cet écart? Est-ce que la population française change très vite d'opinion? Est-ce que les instituts de sondage font mal leur travail?

Ni l'un, ni l'autre en fait. Simplement, les nombres 23,4 et 19,6 n'ont aucun sens donnés seuls. Evidemment, lorsqu'on interroge une partie de la population française, il est impossible de savoir ce que pense exactement toute la population. On n'en obtient qu'une estimation. Et la précision de l'estimation varie, bien sûr, en fonction du nombre de personnes interrogées.

Il y a une théorie mathématique qui quantifie précisément cela, celle des intervalles de confiance. Lorsque qu'un sondage réalisé auprès de n personnes donne comme résultat p% d'intention de vote, des méthodes mathématiques permettent de trouver un intervalle [a,b], contenant p, tel que, avec un risque d'erreur inférieur à 5% par exemple, le pourcentage réel d'intention de vote est compris entre a et b.

Plutôt que de faire une théorie des intervalles de confiance (qu'on trouve ici), voici un exemple. Pour le second tour d'une élection présidentielle, un sondage crédite le candidat A de 53%. Est-on sûr pour autant qu'il va gagner. Les intervalles de confiance, avec un risque d'erreur de 5%, dépendent bien entendu du nombre n de personnes interrogées. Le tableau suivant les donne pour quelques valeurs de n.

Nombre de personnes interrogées : Intervalle de confiance :
100 [43,2;62,8]
1000 [49,9; 56,1]
10000 [52;54]

La première ligne du tableau signifie qu'au terme du sondage, on peut affirmer avec un risque d'erreur inférieur ou égal à 5% que le candidat A fera entre 43,2% et 63,8% des voix. De quoi relativiser les informations péremptoires des journalistes!

Bien sûr, les résultats des sondages devraient toujours être communiquées sous la forme d'un intervalle de confiance. Comme ce n'est jamais le cas, le programme suivant va vous permettre de les reconstituer!

Vous n'avez qu'à rentrer le nombre de gens interrogés et le résultat du sondage.