Statistics for decision

The problem

L'objectif de la régression multiple est d'expliquer une variable quantitative par un certain nombre de prédicteurs, variables quantitatives ou qualitatives.

Nous prendrons dans une premier temps l'exemple suivant : ski99

Il s'agit d'un jeu de données comprenant 98 stations de sport d'hiver en France en 1999. La variable que l'on souhaite expliquer est le Prix journalier du forfait de remontées mécaniques.

Les questions sont similaires à celles énoncées en régression multiple : @@@@@@@@@@@@@@@@@@@@@@@@@@@@erreur ? ? ? simple au lieu de multiple

1) Existe-t-il un modèle permettant d'expliquer le Prix du forfait ?

2) Quelle est la pertinence d'utilisation de ce type de modèle ?

Dans un premier temps, nous allons effectuer une régression simple permettant d'expliquer le Prix du forfait par le Nombre de pistes figurant dans la station.

On obtient, grâce à la méthode des moindres carrés, les résultats suivants :

Ski 99

ce qui donne le modèle

avec une précision de plus ou moins 2x24,786 soit environ plus ou moins 50 FF.

Bien évidemment, la précision de ce modèle n'est pas très bonne.

On peut chercher à l'améliorer en retirant quelques outliers mais on se doute bien que d'autres variables peuvent expliquer le Prix du forfait.

Théoriquement, et de façon académique, une étude spécifique permet d'anticiper les variables qui seront utilisées comme prédicteurs.

Dans la pratique, l'utilisateur aura tendance à vouloir utiliser sans restriction toutes les données dont il dispose, espérant ainsi avoir le meilleur modèle.

Ce n'est pas aussi simple, mais nous partirons donc de ce que l'on peut appeler le modèle complet.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer