Forum de mathématiques - Bibm@th.net
Vous n'êtes pas identifié(e).
- Contributions : Récentes | Sans réponse
#1 10-02-2010 22:10:08
- Bubble
- Membre
- Inscription : 10-02-2010
- Messages : 2
Leverage et distance de Cook en régression pondérée
Bonjour,
Je fais des régressions linéaires pondérées (poids [tex] w_i [/tex]). Mes variables indépendantes sont [tex] x_i [/tex] et mes variables dépendantes sont [tex] y_i [/tex].
Le calcul des régressions pondérées et des résidus ne posent pas de problème.
Par contre, ensuite j'essaie de trouver les outliers en cherchant le leverage et la distance de Cook de chacun de mes coefficients. Je n'arrive pas à trouver les formules pour calculer ces deux notions en version pondérée (en version non pondérée pas de problème).
Je sais que je peux calculer ces valeurs dans R, mais j'ai besoin des formules car je veux programmer ces notions dans un programme indépendant.
Merci d'avance pour vos suggestions pour trouver ces formules dans le cas pondérée
S.
Hors ligne
#2 11-02-2010 16:49:21
- freddy
- Membre chevronné

- Lieu : Paris
- Inscription : 27-03-2009
- Messages : 7 457
Re : Leverage et distance de Cook en régression pondérée
Salut,
tu dois, je pense, savoir lire l'Anglais.
Donc une petite référence technique utile : Disance de Cook
Bye
Hors ligne
#3 15-02-2010 21:43:55
- Bubble
- Membre
- Inscription : 10-02-2010
- Messages : 2
Re : Leverage et distance de Cook en régression pondérée
Bonjour,
Merci Freddy pour le lien Wikipédia que j'avais en fait déjà consulté.
En fait mon erreur provenait du calcul du leverage de chaque individu. Pour ceux que ça intéresse j'ai trouvé comment calculer la "hat matrix" H (dont la diagonale contient les leverage) dans le cas de régression pondérée:
[tex] H=X(X^TWX)^{-1}X^TW [/tex]
L'élément [tex] lev_i=h_{ii} [/tex] est l'influence (leverage) du terme [tex] i [/tex].
En ayant les bonnes valeurs de [tex] lev_i [/tex], j'ai ensuite pu calculer les distances de Cook.
En vérifiant, mon programme avec les résultats obtenus par R, j'ai remarqué que les résultats donnés par les fonctions cooks.distance(lm(y~x,weight=w)) et ls.diag(lm(y~x,weight=w)) de R ne sont pas les mêmes. On dirait qu'une des deux fonctions utilise les résidus non pondérés et l'autre les résidus pondérés. Est-ce que quelqu'un peut me donner une explication sur la différence entre ces deux fonctions?
Merci beaucoup.
S.
Hors ligne
#4 16-02-2010 06:27:35
- freddy
- Membre chevronné

- Lieu : Paris
- Inscription : 27-03-2009
- Messages : 7 457
Re : Leverage et distance de Cook en régression pondérée
Salut,
ta question renvoie plus à la connaissance du soft R que des techniques de régressions. Si tu veux mesurer l'influence d'un "individu" sur la régression, il est nécessaire de rester homogène avec la pondération retenue des individus.
Bis bald
Hors ligne







