Indice de Gini
L'indice de Gini est un coefficient qui évalue la dispersion d'une série statistique. Il se définit en général à partir de la courbe de Lorenz d'une variable aléatoire positive $X$ définie sur une population. L'indice de Gini de $X$ est le double de l'aire de la surface délimitée par la courbe de Lorenz et la première diagonale du carré unité. Remarquons qu'il est toujours compris entre 0 et 1.
Il existe une autre formulation équivalente. Si $X$ est une variable aléatoire positive, l'indice de Gini de $X$ vaut la moitié de la moyenne des différences relatives normalisées : plus concrètement, l'indice de Gini de $X$ vaut $$\frac{E(|X_1-X_2|)}{2E(X)}$$ où $X_1$ et $X_2$ sont deux copies indépendantes de $X$.
Si $X$ est obtenu par une série statistique, ie si dans une population de $n$ individus, on a observé les valeurs $x_1,\dots,x_n,$ alors l'indice de Gini vaut $$\frac{\sum_{i=1}^n \sum_{j=1}^n |x_i-x_j|}{2n^2m}$$ où $m$ est la moyenne arithmétique de $x_1,\dots,x_n,$ c'est-à-dire $$m=\frac{x_1+\cdots+x_n}n.$$
L'indice de Gini est très utilisé en économie comme mesure des inégalités dans une population. Supposons par exemple que la variable $X$ corresponde aux revenus dans une population. Si l'indice de Gini est proche de 0, ceci signifie que les différences relatives sont en moyenne faible par rapport à la moyenne des revenus : les inégalités dans la population sont faibles. Si l'indice de Gini est proche de 1, alors au contraire il y a de fortes différences relatives en moyenne : les inégalités sont fortes!