Statistics for decision

Selection of variables

Pour éviter les conclusions parasites en présence de variables avec une influence peu significative, on va donc améliorer la lisibilité de ce modèle en sélectionnant les variables.

Nous pourrions retirer brutalement toutes les variables n'ayant pas une influence significative.

Mais nous allons proposer une méthode un peu plus fine de sélection des variables à savoir une méthode hiérarchique appelée pas à pas descendante (méthode backward). Ce type de méthode est possible aujourd'hui grâce à la capacité des ordinateurs à effectuer plusieurs fois la construction de modèles de régression multiple.

Algorithme de la méthode pas à pas descendante :

1) On part du modèle complet

2) A chaque étape, on retire la variable ayant le moins d'influence dans le modèle (à savoir la variable Xj ayant le tj le plus petit, ce qui revient au Sig Xj le plus important).

3) On construit un nouveau modèle de régression multiple

4) On réitère le processus jusqu'à ce que toutes les variables soient considérées comme significatives (il faut fixer une valeur seuil pour le Sig, par défaut, 0,10 pour SPSS).

Application sur l'exemple ski99

Ski 99

A la première étape, on retire la variable la moins significative dans le modèle, à savoir nombre de remontées (REM). Puis on recommence jusqu'à obtenir le modèle final (modèle 5) avec API, PIS et LIT.

Etudions de façon un peu plus fine les différents modèles.

On constate que la précision du modèle 4 est légèrement meilleure que celle du modèle 5.

En effet, =16,971 pour le modèle 4 contre 17,075 pour le modèle 5.

Mathématiquement, le modèle 4 est donc meilleur.

Maintenant, le modèle 5 a l'avantage de ne présenter que des variables significatives (la variable KMF dans le modèle 4 présente un niveau de signification de 14,5% ) et également moins de variables pour construire le modèle. Par conséquent, dans l'utilisation future, il y aura moins de données à collecter pour estimer de nouvelles valeurs.

Il appartiendra donc au chargé d'études de choisir le modèle qu'il utilisera, en trouvant le bon compromis entre la précision et la simplicité du modèle.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer