Forum de mathématiques - Bibm@th.net
Vous n'êtes pas identifié(e).
- Contributions : Récentes | Sans réponse
Répondre
Résumé de la discussion (messages les plus récents en premier)
- freddy
- 16-02-2010 06:27:35
Salut,
ta question renvoie plus à la connaissance du soft R que des techniques de régressions. Si tu veux mesurer l'influence d'un "individu" sur la régression, il est nécessaire de rester homogène avec la pondération retenue des individus.
Bis bald
- Bubble
- 15-02-2010 21:43:55
Bonjour,
Merci Freddy pour le lien Wikipédia que j'avais en fait déjà consulté.
En fait mon erreur provenait du calcul du leverage de chaque individu. Pour ceux que ça intéresse j'ai trouvé comment calculer la "hat matrix" H (dont la diagonale contient les leverage) dans le cas de régression pondérée:
[tex] H=X(X^TWX)^{-1}X^TW [/tex]
L'élément [tex] lev_i=h_{ii} [/tex] est l'influence (leverage) du terme [tex] i [/tex].
En ayant les bonnes valeurs de [tex] lev_i [/tex], j'ai ensuite pu calculer les distances de Cook.
En vérifiant, mon programme avec les résultats obtenus par R, j'ai remarqué que les résultats donnés par les fonctions cooks.distance(lm(y~x,weight=w)) et ls.diag(lm(y~x,weight=w)) de R ne sont pas les mêmes. On dirait qu'une des deux fonctions utilise les résidus non pondérés et l'autre les résidus pondérés. Est-ce que quelqu'un peut me donner une explication sur la différence entre ces deux fonctions?
Merci beaucoup.
S.
- freddy
- 11-02-2010 16:49:21
Salut,
tu dois, je pense, savoir lire l'Anglais.
Donc une petite référence technique utile : Disance de Cook
Bye
- Bubble
- 10-02-2010 22:10:08
Bonjour,
Je fais des régressions linéaires pondérées (poids [tex] w_i [/tex]). Mes variables indépendantes sont [tex] x_i [/tex] et mes variables dépendantes sont [tex] y_i [/tex].
Le calcul des régressions pondérées et des résidus ne posent pas de problème.
Par contre, ensuite j'essaie de trouver les outliers en cherchant le leverage et la distance de Cook de chacun de mes coefficients. Je n'arrive pas à trouver les formules pour calculer ces deux notions en version pondérée (en version non pondérée pas de problème).
Je sais que je peux calculer ces valeurs dans R, mais j'ai besoin des formules car je veux programmer ces notions dans un programme indépendant.
Merci d'avance pour vos suggestions pour trouver ces formules dans le cas pondérée
S.







