Le problème
On cherche à étudier le prix des appartements du 19° arrondissement en fonction de leurs surfaces. Pour cela, on dispose d'un échantillon de 33 appartements dont on connaît le prix et la surface.

Plus précisément, les deux questions sont les suivantes :1) Peut-on construire un modèle pour expliquer le prix d'un appartement sachant sa surface ?2) A partir d'une surface donnée, quel est le prix « raisonnable » d'un appartement ?Avant de commencer une étude plus approfondie, il est important de commencer une étude descriptive de chacune des deux variables PRIX et SURFACE.
Dans un second temps, nous allons représenter graphiquement ces données sous la forme d'un nuage de points.
Le problème est de savoir quelle variable sera l'abscisse et quelle variable sera l'ordonnée.
Autrement dit, quel est le nuage de points le plus judicieux ?
Pour répondre à ce problème, reprenons la première question « Peut-on construire un modèle pour expliquer le prix d'un appartement sachant sa surface ? ».
L'objectif est de construire un modèle de la forme Prix = f(Surface).
Dans ces circonstances, il est naturel que Prix soit en ordonnée et Surface en abscisse.
Dans un troisième temps, l'allure du nuage de points suggère un modèle linéaire de la forme Y=b0+b1X.
Comme on peut le voir sur le graphique, il est impossible de trouver des coefficients b0 et b1 pour avoir un modèle Prix=b0+b1Surface.
Pourquoi est-ce impossible ? Tout simplement car on constate sur le graphique que les points ne sont pas totalement alignés.
Le problème est de trouver le meilleur modèle linéaire permettant d'estimer le Prix par la Surface.
Il s'agit donc de trouver b0 etb1 tel que b0 + b1Surface soit la meilleure estimation possible du Prix.
Mais quels coefficients choisir, autrement dit, quelle droite choisir ?
! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! A MODIFIER ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! !
Nous observons les variables Y et X sur n individus. Notons yi et xi les valeurs prises par celles-ci pour l'individu i.
L'objectif est de construire un modèle linéaire entre X et Y . Il s'agit donc de trouver une droite passant "le plus près possible" des points du nuage.
Bien évidemment, la notion de passer le plus près possible n'est pas très mathématique. Le géomètre cherchera à minimiser les distances de la droite à chaque point du nuage. Mais ceci est très compliqué, et le statisticien aura d'autres intérêts et une autre méthode. Il va utiliser la méthode des moindres carrés. Nous avons expliqué les notations xi et yi.
Introduisons maintenant la notation . Il s'agit donc de l'estimation de yi pour un xi donné grâce au modèle espéré.
@@@@ Etc etc à reprendre sur les bases de stats







