Variables instrumentales/Sources d'endogénéité
Ce chapitre explique l'endogénéité et expose les différentes sources d'endogénéité.
Introduction
[modifier | modifier le wikicode]La technique des variables instrumentales découle des modèles de régressions. Dans les modèles de régressions on veut estimer les paramètres associés à plusieurs variables dont on suppose qu’elles ont un effet sur une tierce variable.
La technique des variables instrumentales permet, lorsque l'information est disponible, d'estimer un paramètre qui aurait été biaisé s'il avait été estimé par la méthode des moindres carrés ordinaire .
Soit le modèle de régression linéaire :
- .
L'hypothèse la plus importante pour l'estimation par MCO est l'absence de corrélation entre les variables explicatives et le terme d'erreur. Cette hypothèse est l'hypothèse d'exogénéité. Dans le modèle ci-dessus, les deux variables explicatives sont supposées exogènes. Dans un modèle de régression, une variable est considéré comme exogène lorsque :
- .
Biais de l'estimateur
[modifier | modifier le wikicode]Soit le modèle vu en introduction. Dans ce modèle, on va tout d’abord supposer que la variable est endogène, c'est-à-dire que l’on a la relation suivante entre :
- ,
ce qui implique que l'hypothèse n'est plus vérifiée.
Nous savons que l'estimation par MCO des paramètres donne le résultat suivant :
où X est la matrice des variables explicatives, y compris la colonne de la constante et y le vecteur de la variable expliquée.
En remplaçant y par son expression suivant le modèle de régression on obtient
- .
Si nous avions pu poser l'hypothèse , alors nous aurions pu montrer que n’est pas biaisé :
- .
Mais comme cette hypothèse n’est pas vérifiée, nous montrons que l'estimateur de est biaisé
- .
Sources d'endogénéité
[modifier | modifier le wikicode]On considère généralement trois sources d'endogénéité d'une variable explicative. La première, qui est celle qui est traitée dans l'exo 1, est la variable omise.
Imaginons que, dans l'équation 1, la variable est corrélée avec une variable que l’on n'a pas à notre disposition. De fait, la variable est comprise dans le terme d'erreur . Ainsi, ce qui implique que n'est plus vérifiée.