Bibm@th

Forum de mathématiques - Bibm@th.net

Bienvenue dans les forums du site BibM@th, des forums où on dit Bonjour (Bonsoir), Merci, S'il vous plaît...

Vous n'êtes pas identifié(e).

#1 10-02-2010 22:10:08

Bubble
Membre
Inscription : 10-02-2010
Messages : 2

Leverage et distance de Cook en régression pondérée

Bonjour,

Je fais des régressions linéaires pondérées (poids  [tex] w_i [/tex]). Mes variables indépendantes sont  [tex] x_i [/tex] et mes variables dépendantes sont  [tex] y_i [/tex].

Le calcul des régressions pondérées et des résidus ne posent pas de problème.

Par contre, ensuite j'essaie de trouver les outliers en cherchant le leverage et la distance de Cook de chacun de mes coefficients. Je n'arrive pas à trouver les formules pour calculer ces deux notions en version pondérée (en version non pondérée pas de problème).

Je sais que je peux calculer ces valeurs dans R, mais j'ai besoin des formules car je veux programmer ces notions dans un programme indépendant.

Merci d'avance pour vos suggestions pour trouver ces formules dans le cas pondérée

S.

Hors ligne

#2 11-02-2010 16:49:21

freddy
Membre chevronné
Lieu : Paris
Inscription : 27-03-2009
Messages : 7 457

Re : Leverage et distance de Cook en régression pondérée

Salut,

tu dois, je pense, savoir lire l'Anglais.

Donc une petite référence technique utile : Disance de Cook

Bye

Hors ligne

#3 15-02-2010 21:43:55

Bubble
Membre
Inscription : 10-02-2010
Messages : 2

Re : Leverage et distance de Cook en régression pondérée

Bonjour,

Merci Freddy pour le lien Wikipédia que j'avais en fait déjà consulté.

En fait mon erreur provenait du calcul du leverage de chaque individu. Pour ceux que ça intéresse j'ai trouvé comment calculer la "hat matrix" H (dont la diagonale contient les leverage) dans le cas de régression pondérée:
[tex] H=X(X^TWX)^{-1}X^TW [/tex]

L'élément [tex] lev_i=h_{ii} [/tex] est l'influence (leverage) du terme [tex] i [/tex].

En ayant les bonnes valeurs de  [tex] lev_i [/tex], j'ai ensuite pu calculer les distances de Cook.


En vérifiant, mon programme avec les résultats obtenus par R, j'ai remarqué que les résultats donnés par les fonctions cooks.distance(lm(y~x,weight=w)) et ls.diag(lm(y~x,weight=w)) de R ne sont pas les mêmes. On dirait qu'une des deux fonctions utilise les résidus non pondérés et l'autre les résidus pondérés. Est-ce que quelqu'un peut me donner une explication sur la différence entre ces deux fonctions?


Merci beaucoup.

S.

Hors ligne

#4 16-02-2010 06:27:35

freddy
Membre chevronné
Lieu : Paris
Inscription : 27-03-2009
Messages : 7 457

Re : Leverage et distance de Cook en régression pondérée

Salut,

ta question renvoie plus à la connaissance du soft R que des techniques de régressions. Si tu veux mesurer l'influence d'un "individu" sur la régression, il est nécessaire de rester homogène avec la pondération retenue des individus.

Bis bald

Hors ligne

Réponse rapide

Veuillez composer votre message et l'envoyer
Nom (obligatoire)

E-mail (obligatoire)

Message (obligatoire)

Programme anti-spam : Afin de lutter contre le spam, nous vous demandons de bien vouloir répondre à la question suivante. Après inscription sur le site, vous n'aurez plus à répondre à ces questions.

Quel est le résultat de l'opération suivante (donner le résultat en chiffres)?
soixante treize plus soixante deux
Système anti-bot

Faites glisser le curseur de gauche à droite pour activer le bouton de confirmation.

Attention : Vous devez activer Javascript dans votre navigateur pour utiliser le système anti-bot.

Pied de page des forums