Objectives of the classification
Les bases de données sont souvent très importantes en taille, que ce soit en nombre de variables et en nombre d'individus.
L'analyse factorielle permet de réduire le nombre de variables.
La classification (ou la segmentation) permet elle de classer les individus en groupes (également appelés clusters) qui seront beaucoup plus faciles à interpréter que la totalité des individus.
Pour mesurer l'intérêt de la classification, prenons l'exemple « coupons ».
Une entreprise envoie 3000 coupons de réduction à un échantillon aléatoire de ses clients. Cette opération a un cout de 0,3 euros par coupon, soit un cout global de 900 euros.
60 d'entre eux ont été utilisés (il y a 2% des coupons utilisés), chacun d'entre eux rapportant 10 euros de bénéfice après la vente du produit. Le bénéfice de la vente est donc de 600 euros.
Cette opération est donc déficitaire de 600 – 900 euros, soit 300 euros.
Imaginons maintenant que l'entreprise cherche à segmenter sa clientèle en 3 groupes que nous appellerons A, B et C.
Elle envoie tout d'abord 100 coupons à un échantillon de 100 personnes dans chacun des groupes.
Aucun coupon n'est utilisé dans le groupe A, 5 sont utilisés dans le groupe B et 1 dans le groupe C.
Le taux d'utilisation global est le même que précédemment, à savoir 2%.
Mais on peut identifier clairement le groupe intéressé par cette opération. On enverra donc le reste des coupons de réduction (2700 coupons) qu'à des personnes dans le groupe B, qui a un taux de retour espéré de 5%. On peut donc attendre 135 commandes, soit un bénéfice de 1350 euros, largement supérieur à l'investissement de l'opération coupons.
Il est donc important que ces groupes soient constitués le mieux possible en respectant deux critères :
deux individus appartenant au même groupe doivent être très proches en terme de comportement (faible variance intra-classe).
deux individus dans deux groupes différents doivent avoir des comportements éloignés (forte variance inter-classe).
Nous pouvons résumer ceci par une maxime très simple : « Qui s'assemble se ressemble ».
Il existe de nombreuses méthodes de classification, d'autant plus utilisables aujourd'hui grâce à la capacité des ordinateurs.
Nous en présenterons quelques unes permettant de comprendre l'esprit des méthodes de classification.




