Bonjour,
Étant une buse finie, personne avec un niveau assez discutable en économétrie, j'apprécierais fortement un coup de main sur un problème économétrique.
J'ai une assez grosse base de données (plusieurs centaines d'individus, et une vingtaine de paramètres). Pour simplifier on dira que j'ai comme variable à prédire y, et comme variables prédictives x0, x1... x20.
Le but de l'exercice est donc d'expliquer y en utilisant le modèle le plus adapté.
La joie de la fac fait que je n'ai pas vraiment de support de cours (heureusement notre ami google est là). Du coup mes questions sont les suivantes :
-Dans les données, j'ai une variable qui de temps en temps a un champ vide. Comment gérer ça ? Dans un premier temps j'ai utilisé les MCO sans les individus avec ces variables, et je me demandais ensuite s'il serait judicieux de remplir artificiellement les champs vide à partir du modèle généré sans ces individus, puis d'à nouveau faire un modèle global qui prendra en compte tout le monde. Ça me semble dommage d'ignorer 19 variables prédictives parce que la 20ème est vide. Pour info il y a en gros 3% de personnes avec un champ vide.
-J'ai pas mal de variable binaires, dont une, x3 qui est égale à 1-x2+x1 (un truc classique du genre 1 pour x1 si moins d'1m50, 0 sinon. 1 pour x2 si entre 1m50 et 1m80, 0 sinon. Et 1 pour x3 si plus d'1m80, donc forcément la somme des trois vaut 1). Dans ce cas il y a une multicolinéarité parfaite, et je peux donc supprimer x3 (ou x2 ou x1) du modèle donc ? Quelle que soit la méthode utilisée ?
-Comment déterminer quel est le meilleur modèle ? En appliquant les MCO (sur Gretl) j'ai un R² de 0.116, et seulement 5 variables avec un p-value en dessous de 0.1. Du coup j'suis preneur de tout conseil à ce niveau là : quels autres paramètres sont importants pour déterminer si ce modèle est bon, quels autres modèles utiliser, comment déterminer s'ils sont meilleurs, etc.
Merci d'avance infiniment pour votre aide !
(Bien sur, si quelqu'un a envie de faire le sujet par lui même, challenge personnel, BA du jour, toussah, j'suis tout à fait preneur =D)
Message édité par tahn le 06-03-2013 à 18:25:10