Statistics for decision

Introduction de nouvelles variables interactives

Nous pouvons également être confrontés à un modèle différent selon les modalités d'une variable qualitative.

Etudions l'exemple "Salaires".

Nous disposons des données d'une entreprise et des salaires des différentes personnes en fonction de leur âge, ce que nous observons dans un nuage de données.

Salaire

Mais en introduisant une variable supplémentaire, à savoir le genre de la personne (féminin ou masculin), nous obtenons le nuage catégorisé avec en bleu les hommes et en vert les femmes.

Salaire (avec variable genre)

Nous pouvons construire différents modèles à partir de ce jeu de données.

Le modèle 1 ne tient pas compte du genre

Salaire=b0+b1Age+résidu

@@@@ A faire dans SPSS.

Le modèle 2 utilise la variable genre. Pour cela, on crée la variable indicatrice « Femme »

ce qui donne le modèle Salaire=b'0+b'1Age +b'2Femme+résidu

@@@@@ A faire dans SPSS

Nous aurions pu choisir également la variable indicatrice « Homme », nous aurions obtenu comme résultat :

@@@@ A faire dans SPSS

Mais, un problème subsiste.

En effet, en observant le nuage de points, nous voyons que la progression est plus rapide chez les hommes que chez les femmes et donc que l'écart s'accentue chez les personnes les plus âgées, ce qui n'est pas traduit dans le modèle 2.

Modèle 2

On recherche en fait un modèle dont les pentes seraient différentes selon que l'on observe les hommes ou les femmes.

Pour cela, nous allons introduire une variable interactive entre l'âge et le genre et construire la variable X3= Age x femme .

Nous avons donc le jeu de données suivant :

@@@@@ A créer sous SPSS

Salaire=b''0+b''1Age+b''2Femme+b''3Age*Femme+résidu

@@@ titre image

Nous obtenons donc, après une méthode pas à pas descendante, le modèle final :

= 5551,632 – 272,134 Womanage + 862,111 Age.

Ce qui donne effectivement deux modèles :

pour les hommes = 5551,631 + 862,111 Age

et pour les femmes = 5551,631 – 272,134 Age + 862,111 Age = 5551,631 + 589,977 Age

Ces deux modèles collent plus à la réalité proposée par le nuage de points, à savoir pas de différence en début de carrière mais une progression plus lente pour les femmes (pente plus faible pour le modèle correspondant aux femmes).

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer