Statistics for decision

Using the model

Grâce aux coefficients b0 et b1 que l'on sait maintenant calculer, on peut estimer le prix d'un appartement connaissant la surface donnée.

Par exemple, si nous visitons un appartement de 50 m², on peut estimer le prix à 29,939 +5,476 x 50 = 303,739.

Or, imaginons que cet appartement nous soit proposé au prix de 320. Il est au dessus du marché, certes, mais est-ce que ce prix est raisonnable ?

Plus qu'une valeur estimée, il serait préférable d'avoir un intervalle des prix pour une valeur de la surface donnée.

Or, on a écrit le modèle sous la forme

On peut également l'écrire sous la forme

Y = b0 + b1 X + terme résiduel

Attardons nous sur ce terme résiduel.

Il est différent pour chaque individu. Pour les individus constituant l'échantillon, ce terme résiduel correspond aux ei utilisés pour la méthode des moindres carrés.

Ce terme résiduel (pour tous les individus de la population et pas seulement ceux ayant permis de construire le modèle) est donc une variable que l'on notera ε.

Or, grâce à la construction issue de la méthode des moindres carrés, on a la propriété suivante (que l'on ne démontrera pas).

Proposition : ε suit une loi normale d'espérance 0 et d'écart-type que l'on notera .

Avantage immédiat : on connait les propriétés de la loi normale et notamment on peut dire que 95% des valeurs de ε seront comprises entre -1,96 et + 1,96.

Inconvénient : sigma est l'écart-type de ε sur toute la population et est donc inconnu.

Par contre, on connait un certain nombre de valeurs de la variable ε, à savoir les ei provenant de l'échantillon ayant permis de construire le modèle.

On va donc estimer sigma de la façon suivante :

Ce qui nous permet de dire que 95% des valeurs de ε sont comprises entre -1,96et 1,96, que l'on arrondira à -2 et +2 sigma ^.

Par conséquent, on obtient maintenant un intervalle de prévision pour chaque valeur de Y estimée, à savoir

avec et

Application numérique

Estimation de Sigma

est la racine de 170764,6 / 31, soit la racine de 5508,535.

=74,22.

On peut également observer directement sur les sorties SPSS où il est appelé standard error of the estimate.

Sortie standard SPSS

Reprenons notre appartement de 50 m².

On avait estimé le prix à  = 29,939 +5,476 * 50 = 303,739

On peut donc avoir un intervalle de prévision de , ce qui donne dans l'exemple 148,5 comme précision.

La démarche du statisticien sera donc ensuite de pouvoir améliorer le modèle afin de gagner en précision. Pour cela, il y a plusieurs possibilités qui seront présentées dans la suite.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer