Moyennes mobiles
La méthode des moyennes mobiles (k means) fonctionne sur un choix a priori du nombre de groupes que nous souhaitons construire.
k centres de gravité aléatoires sont choisis initialement.
Chaque individu est ensuite affecté au groupe du centre de gravité dont il est le plus proche (avec une distance euclidienne classique, et bien évidemment avec des données standardisées).
Puis, on calcule les k nouveaux centres de gravité et on réitère le processus jusqu'à ce que les centres de gravité ne bougent plus de façon significative.
Prenons l'exemple suivant, dans une classe, des élèves ont les notes 4;6;10;11;12;19 et 20.
Le professeur souhaite les séparer en 3 groupes.
Prenons 4 ; 6 et 10 comme centres de gravité choisis aléatoirement des groupes A, B et C.
Chaque élève est ensuite affecté au groupe dont il est le plus proche par rapport au centre de gravité.
Cliquer sur l'animation ci-dessous pour voir comment le processus se stabilise.
Bien évidemment, il n' y a pas obligation de convergence, et le choix des centres de gravité initiaux peut avoir une influence.
Mais lorsqu'on manie un nombre important d'individus, ce qui est a priori le cas lorsqu'on souhaite faire une classification, le risque de non convergence est faible.
@@@@ Montrer un autre exemple avec des sorties SPSS peut être sur autos2004




