$$\newcommand{\mtn}{\mathbb{N}}\newcommand{\mtns}{\mathbb{N}^*}\newcommand{\mtz}{\mathbb{Z}}\newcommand{\mtr}{\mathbb{R}}\newcommand{\mtk}{\mathbb{K}}\newcommand{\mtq}{\mathbb{Q}}\newcommand{\mtc}{\mathbb{C}}\newcommand{\mch}{\mathcal{H}}\newcommand{\mcp}{\mathcal{P}}\newcommand{\mcb}{\mathcal{B}}\newcommand{\mcl}{\mathcal{L}} \newcommand{\mcm}{\mathcal{M}}\newcommand{\mcc}{\mathcal{C}} \newcommand{\mcmn}{\mathcal{M}}\newcommand{\mcmnr}{\mathcal{M}_n(\mtr)} \newcommand{\mcmnk}{\mathcal{M}_n(\mtk)}\newcommand{\mcsn}{\mathcal{S}_n} \newcommand{\mcs}{\mathcal{S}}\newcommand{\mcd}{\mathcal{D}} \newcommand{\mcsns}{\mathcal{S}_n^{++}}\newcommand{\glnk}{GL_n(\mtk)} \newcommand{\mnr}{\mathcal{M}_n(\mtr)}\DeclareMathOperator{\ch}{ch} \DeclareMathOperator{\sh}{sh}\DeclareMathOperator{\th}{th} \DeclareMathOperator{\vect}{vect}\DeclareMathOperator{\card}{card} \DeclareMathOperator{\comat}{comat}\DeclareMathOperator{\imv}{Im} \DeclareMathOperator{\rang}{rg}\DeclareMathOperator{\Fr}{Fr} \DeclareMathOperator{\diam}{diam}\DeclareMathOperator{\supp}{supp} \newcommand{\veps}{\varepsilon}\newcommand{\mcu}{\mathcal{U}} \newcommand{\mcun}{\mcu_n}\newcommand{\dis}{\displaystyle} \newcommand{\croouv}{[\![}\newcommand{\crofer}{]\!]} \newcommand{\rab}{\mathcal{R}(a,b)}\newcommand{\pss}[2]{\langle #1,#2\rangle} $$
Bibm@th

Analyse de données statistiques : espérance, variance, écart-type

L'espérance d'une série statistique $X=(x_i)_{i=1,\dots,N}$ est la moyenne des valeurs de cette série statistique : $$E(X)=\bar X=\frac{x_1+\cdots+x_N}{N}.$$

La variance et l'écart-type mesurent eux la dispersion des valeurs de cette série statistique autour de sa moyenne. La variance $V(X)$ est définie par $$V(X)=\frac 1N\left((x_1-\bar X)^2+\cdots+(x_N-\bar X)^2\right)=\frac 1N\sum_{k=1}^N \left(x_k-\bar X\right)^2.$$ Elle est donc égale à la moyenne des carrés des différences entre les observations $x_i$ et leur moyenne $\bar X$.

L'écart-type, noté $\sigma_X$, est la racine carrée de la variance : $$\sigma(X)=\sqrt{V(X)}=\sqrt{\frac 1N\sum_{k=1}^N \left(x_k-\bar X\right)^2}.$$ L'écart-type s'exprime dans les mêmes unités que $X$ : si $X$ désigne des longueurs en $m,$ alors $\sigma(X)$ s'exprime aussi en $m.$

Si la série statistique est donnée par un tableau statistique $(x_i,n_i)$, ce qui signifie que la valeur $x_i$ est prise $n_i$ fois, on peut directement calculer la variance par la formule : $$V(X)=\frac{1}{n_1+\cdots+n_N} \sum_{i=1}^N n_i (x_i-\bar X)^2.$$

Voyons ce que signifie l'écart-type. Dans une classe de 25 élèves, à un devoir, on observe les notes suivantes :

  • 5 notes à 8.
  • 5 notes à 9.
  • 5 notes à 10.
  • 5 notes à 11.
  • 5 notes à 12.

L'espérance (ou moyenne des notes!) est 10. La variance vaut $$V=\frac1{25}\left(5\times 2^2+5\times 1^2 +5\times 0^2+5\times 1^2+5\times 2^2\right)=2.$$ Elle est assez faible, les notes sont donc très centrées autour de la moyenne.

Dans une autre classe de 25 élèves, au même devoir, les élèves ont obtenu :

  • 5 notes à 0.
  • 5 notes à 5.
  • 5 notes à 10.
  • 5 notes à 15.
  • 5 notes à 20.

L'espérance vaut toujours 10, mais pourtant il est clair que les deux classes sont très différentes! Calculons la variance : elle vaut $$V=\frac1{25}\left(5\times 10^2+5\times 5^2+5\times 0^2+5\times 5^2+5\times 10^2\right)=50.$$ La variance est beaucoup plus grande que dans le premier cas, ce qui signifie que les notes sont très espacées!

Consulter aussi
Recherche alphabétique
Recherche thématique