PSY38X2 : Traitement de données en Psychologie - TD N5

F de Fisher - Analyse de variance

 

1) Comparaison de deux variances

1.1 Comparaison de deux variances avec Minitab

On reprend les données de l'exercice 8 de la fiche de TD de statistiques.

Chargez Minitab et ouvrez le projet W:\PSY3\PSY38X2\TR-lampes.mpj

Voir aussi la correction ici.

 

Observez la feuille de données : on a saisi l'ensemble des données dans les colonnes Experience et TR, et les données relatives aux expériences 1 et 2 dans les colonnes Exp-1-2 et TR-1-2.

 

Utilisez le menu Stat - ANOVA - Test de comparaison de la variance... pour comparer les variances des temps de réaction des deux premières expériences. Vous devriez obtenir :

Comparez ensuite les variances des trois expériences : Minitab utilise dans ce cas un autre test : le test de Bartlett.

1.2 Comparaison de deux variances avec Excel, sans Utilitaire d'Analyse

Ouvrez le fichier W:\PSY3\PSY38X2\TR-lampes.xls et examinez les données saisies.

Calculez en B23:D23 les variances des temps de réaction des trois séries de données.

Calculez en B24 la valeur observée de la statistique de test.

Indiquez les degrés de liberté du numérateur et du dénominateur en B25 et B26.

Pour calculer le niveau de significativité (cellule B28), on pourra utiliser la fonction LOI.F. La fonction inverse, qui permet le calcul de F critique, est la fonction INVERSE.LOI.F.

 

A

B

C
23 Variance =VAR(B2:B21) =VAR(C2:C21)
24 Valeur de F =C23/B23
25 ddl1 19
26 ddl2 19
27 Seuil 0,05
28 Niveau de significativité =LOI.F(B24;B25;B26)
29 F critique =INVERSE.LOI.F(B27;B25;B26)

 

1.3 Comparaison de deux variances à l'aide de l'utilitaire d'analyse

L'utilitaire d'analyse comporte un item nommé Test d'égalité des variances (F-test) permettant de réaliser le traitement précédent. Le dialogue pourra être complété comme suit :

ce qui permettra d'obtenir les résultats suivants :

Test d'égalité des variances (F-Test)

Expérience 1

Expérience 2
Moyenne

19,75

40,95

Variance

15,67105263

56,68157895

Observations

20

20

Degré de liberté

19

19

F

0,276475231

P(F<=f) unilatéral

0,003689267

Valeur critique pour F (unilatéral)

0,461200855

 

Remarquez qu'Excel fait un test unilatéral "à gauche", alors qu'en cours nous nous sommes limités à l'étude du cas où l'hypothèse H1 est de la forme s 1>s 2.

2) Analyse de variance à un facteur

2.1 - Analyse de variance à 1 facteur avec Minitab

On reprend la situation décrite dans l'exercice 15 de la fiche de TD de statistiques.

Chargez Minitab et ouvrez le projet W:\PSY3\PSY38X2\Loftus.mpj

Voir aussi le corrigé ici.

On se propose de comparer les 5 groupes des données Loftus et effectuant une analyse de variance. En toute rigueur, on s'est assuré au préalable de l'homogénéité des variances et de la normalité des distributions (menu Stat - Statistiques Elémentaires - Test de Normalité...).

 

Utilisez le menu Stat - ANOVA - A un facteur contrôlé.... Complétez la fenêtre de dialogue comme suit :

A l'aide du bouton "graphiques", demandez aussi la composition d'un graphique en "boîtes à moustaches" pour les données.

Minitab fournit le tableau d'analyse de variance suivant :

 

Le graphique permet de situer les variables les unes par rapport aux autres :

Remarque : L'analyse de variance peut aussi être réalisée à partir des données saisies dans les colonnes C4 à C8. Mais il faut alors sélectionner le menu Stat - ANOVA - A un facteur contrôlé (désempilé)...

Exercice

Ouvrez sous Minitab le fichier W:\PSY3\PSY38X2\Bransfor.MPJ. Voir aussi le corrigé ici.

Ce fichier contient l'énoncé et les données de l'exercice 14 de la fiche de TD de statistiques.

Vérifiez à l'aide de Minitab les différents résultats indiqués sur la fiche de TD (sommes par groupe, tableau d'analyse de variance, etc).

 

2.2 - Analyse de variance à un facteur avec Excel

On considère les données décrites dans l'énoncé "Données Bransfor" (énoncé 38), qui ont été saisies dans la feuille BRANSFOR du classeur W:\PSY3\PSY38X2\Bransfor.XLS.

Nous allons tester l'hypothèse "dans les populations parentes, les moyennes des quatre groupes sont différentes" à l'aide d'une analyse de variance.

Dans la panoplie de fonctions d'Excel, il n'existe pas de fonction permettant de faire directement une analyse de variance. Nous allons donc recourir à l'Utilitaire d'Analyse.

Sélectionnez le menu Outils-Utilitaire d'analyse... puis l'item Analyse de variance: un facteur.

Complétez la fenêtre de dialogue comme suit :

Parmi les résultats calculés par Excel, on trouve alors le tableau d'analyse de variance suivant, que l'on comparera à celui figurant sur la fiche de TD :

ANALYSE DE VARIANCE

Source des variations

Somme des carrés

Degré de liberté

Moyenne des carrés

F

Probabilité

Valeur critique pour F
Entre Groupes

50,95

3

16,98

7,23

0,28%

3,24

A l'intérieur des groupes

37,6

16

2,35

Total

88,55

19

 

 

 

3) Analyse de variance pour un plan S*A

3.1 - Traitement d'un plan S*A avec Minitab

Chargez Minitab et ouvrez le projet W:\PSY3\PSY38X2\INHIBIT.MPJ. Voir également le corrigé ici.

Ce cas est décrit dans l'énoncé 26 de la fiche distribuée en TD de statistiques

Nous allons tester l'hypothèse : "le nombre de paires correctement rappelées dépend de la position ordinale dans la liste" à l'aide d'une analyse de variance. Deux facteurs doivent ici être pris en compte : le facteur "position ordinale" et le facteur "sujet" (car les sujets sont croisés avec l'autre facteur.

 

Observez attentivement la façon dont les données ont été saisies : chacun des facteurs, et la variable dépendante, sont saisis dans des colonnes différentes.

 

Utilisez le menu Stat - ANOVA - A deux facteurs contrôlés... et complétez le dialogue comme suit :

 

Retrouvez ainsi les résultats donnés sur la fiche de TD de Statistiques, c'est-à-dire :

 

Analyse de variance pour Nb mots

Source DL SC CM F P

Position 5 146,85 29,37 10,32 0,000

Sujet 7 52,48 7,50 2,63 0,027

Erreur 35 99,65 2,85

Total 47 298,98

 

On peut obtenir une représentation graphique donnant les moyennes par condition expérimentale (c'est-à-dire par position dans la liste) en utilisant le menu Stat - ANOVA - Analyse de moyennes ....

Complétez le dialogue de manière à obtenir le résultat suivant :

3.2 - Traitement d'un plan S*A avec Excel

Affichez la feuille de données INHIBIT du fichier W:\PSY3\PSY38X2\Inhibit.xls. Ce cas est décrit dans l'énoncé 26 de la fiche de TD.

Nous allons tester l'hypothèse : "le nombre de paires correctement rappelées dépend de la position ordinale dans la liste" à l'aide d'une analyse de variance. Deux facteurs doivent ici être pris en compte : le facteur "position ordinale" et le facteur "sujet" (car les sujets sont croisés avec l'autre facteur. Remarquez que l'on dispose d'une seule valeur de la variable dépendante pour chaque combinaison des deux facteurs. Pour Excel, il s'agit de deux facteurs sans répétition d'expérience.

Sélectionnez le menu Outils-Utilitaire d'analyse... puis l'item Analyse de variance: deux facteurs sans répétition d'expérience.

Complétez la fenêtre de dialogue comme suit :

Dans le tableau d'analyse dressé par Excel, seul le rapport F calculé pour les colonnes nous intéresse.

ANALYSE DE VARIANCE

Source des variations

Somme des carrés

Degré de liberté

Moyenne des carrés

F

Probabilité
Lignes

52,48

7

7,50

2,63

2,69%

Colonnes

146,85

5

29,37

10,32

3,87E-06

Erreur

99,65

35

2,85

Total

298,98

47

 

 

4) Analyse de variance pour un plan S<A*B>

4.1 - Traitement d'un plan S<A*B> avec Minitab

 

Ouvrez le fichier W:\PSY3\PSY38X2\Multimedia.MPJ. Ce fichier reprend la situation présentée dans l'exercice 33 de la fiche de TD de statistiques.

Le corrigé se trouve ici.

 

Le plan d'expérience correspondant est : S<Présentation * Rappel>

Utilisez le menu Stat - ANOVA - ANOVA équilibrée et complétez la fenêtre de dialogue comme suit :

 

 

Construire un graphe montrant l'interaction entre les variables Présentation et Rappel.

Un tel graphique peut notamment être obtenu à l'aide du menu Stat - ANOVA - Diagramme des interactions...

On devrait ainsi obtenir le diagramme d'interaction suivant :

Exercice : on sait que, dans un graphe d'interaction les deux facteurs mis en jeu jouent des rôles analogues. Utilisez le menu précédent pour obtenir le graphe d'interaction sous la forme équivalente suivante :

 

4.2 - Traitement d'un plan S<A*B> avec Excel

Dans le cas d'un plan S<A*B>, on considère les deux facteurs de variation A et B. Le facteur Sujet est assimilé à une mesure répétée dans chaque condition expérimentale.

 

Ouvrez le fichier W:\PSY3\PSY38X2\Tulving.xls et affichez la feuille de données TULVING. Ce cas est décrit dans l'énoncé 30 de la fiche de TD de statistiques. Observez la façon dont les données ont été saisies.

Nous allons étudier les différentes hypothèses formulées dans l'énoncé à l'aide d'une analyse de variance.

Sélectionnez le menu Outils-Utilitaire d'analyse... puis l'item Analyse de variance: deux facteurs avec répétition d'expérience.

Complétez la fenêtre de dialogue comme suit :

On obtient le tableau d'analyse de variance suivant :

ANALYSE DE VARIANCE

Source des variations

Somme des carrés

Degré de liberté

Moyenne des carrés

F

Probabilité

Valeur critique pour F
Echantillon

2080,00

2

1040,00

115,56

3,08E-20

5,02

Colonnes

201,67

1

201,67

22,41

1,63E-05

7,13

Interaction

213,33

2

106,67

11,85

5,40E-05

5,02

A l'intérieur du groupe

486,00

54

9,00

Total

2981,00

59

 

Ce tableau permet d'apporter des réponses aux hypothèses qui ont été formulées. Mais il faut recourir à d'autres outils pour obtenir sans mal un graphe d'interaction (dont la construction ne pose pourtant pas de difficulté).

 

 

5) Analyse de variance pour un plan S<A>*B

Le traitement de ce type de plan dépasse les possibilités de l'utilitaire d'analyse. Nous utiliserons donc seulement Minitab dans ce cas.

 

Ouvrez le fichier W:\PSY3\PSY38X2\King.MPJ.

 

Les données qui y sont saisies sont celles de l'énoncé 36 de la fiche de TD de Statistiques. Le plan d'expériences utilisé par King est du type S8<A3>*B6. Plus précisément, il s'agit du plan S<Groupe>*Intervalle. Les logiciels de traitement statistique ne prévoient pas toujours ce type de plan "à mesures partiellement répétées". Nous ne pourrions, par exemple, utiliser Excel ou Statgraphics. En revanche, ce cas peut être traité par Minitab, en utilisant le menu Stat - ANOVA - Modèle linéaire généralisé... On complète la fenêtre de dialogue comme suit :

 

 

Notez la manière dont on indique à Minitab l'emboîtement des sujets dans les groupes et l'interaction. Remarquez en particulier la zone de dialogue "Facteurs Aléatoires". Il est indispensable d'y mentionner le facteur sujet pour que la statistique F relative au facteur Groupe soit calculée en utilisant le carré moyen relatif à la source de variation Sujet(Groupe) au dénominateur.

 

On devrait obtenir comme résultat :

 

Analyse de la variance pour Ambulato, en utilisant la SC ajustée pour les tests

 

Source DL SC Séq SC Ajust CM Ajust F P

Groupe 2 285815 285815 142908 7.80 0.003

Sujet(Groupe) 21 384722 384722 18320 6.84 0.000

Interval 5 399737 399737 79947 29.85 0.000

Groupe*Interval 10 80820 80820 8082 3.02 0.002

Erreur 105 281199 281199 2678

Total 143 1432293

 

 

On pourra comme précédemment, obtenir un graphe de l'interaction entre les variables Intervalle et Groupe à l'aide du menu Graphiques - Carte ... ou plus simplement Stat - ANOVA - Diagramme des interactions...

 

Exercice 1 : Réaliser le graphique suivant :

 

Exercice 2 : Saisir les données "Conrad" dans une feuille de calcul Minitab et réaliser une analyse de variance permettant de retrouver les résultats de l'exercice 34 de la fiche de TD de statistiques.

6) Autres plans d'expérience

Ouvrez le fichier W:\PSY3\PSY38X2\Syssau.MPJ.

 

Il s'agit ici d'un plan d'expérience assez complexe, de type S<T2*C2*M2>

Observez la façon dont les données ont été saisies.

 

On veut d'abord faire une analyse de variance portant sur l'ensemble de l'expérience. Les facteurs à prendre en compte sont : Type Texte, Connotation, Mémoire. Pour les interactions, il faut tenir compte des interactions des facteurs pris deux à deux, et de l'interaction triple entre les trois facteurs.

 

Pour exécuter l'analyse de variance sous Minitab, on utilise donc le menu Stat - ANOVA - Modèle linéaire généralisé (ou ANOVA équilibrée...) en complétant le dialogue de la façon suivante :

 

 

On devrait ainsi obtenir le tableau d'analyse de variance suivant :

 

Source DL SC Séq SC Ajust CM Ajust F P

Type Tex 1 63.013 63.013 63.013 12.58 0.001

Connot 1 1.513 1.513 1.513 0.30 0.584

Mémoire 1 4.513 4.513 4.513 0.90 0.346

Type Tex*Connot 1 1.013 1.013 1.013 0.20 0.654

Type Tex*Mémoire 1 1.513 1.513 1.513 0.30 0.584

Connot*Mémoire 1 21.012 21.012 21.012 4.19 0.044

Type Tex*Connot*Mémoire 1 0.112 0.112 0.112 0.02 0.881

Erreur 72 360.700 360.700 5.010

Total 79 453.387

 

7) Monitorat

Exercice 1 :

Saisissez les données de l'exercice 23 de la fiche de TD de statistiques (données Craik). Retrouvez les résultats indiqués, d'abord en interprétant les données comme celles d'un plan S<A>, puis en interprétant les données comme celles d'un plan S*A.

Exercice 2

Ouvrez le fichier W:\PSY3\PSY38X2\Neglige.MPJ et traitez les questions figurant dans l'énoncé. cf. correction ici.

Les données saisies sont celles de l'énoncé 33 des fiches de TD de statistiques.

 

Pour le tableau d'analyse de variance, vous devriez aboutir à quelque chose du genre suivant :

 

Source DL SC Séq SC Ajust CM Ajust F P

Conditio 1 0.000 0.000 0.000 0.00 0.997

Sujet(Conditio) 22 31.658 31.658 1.439 1.13 0.324

Main 1 21.275 21.275 21.275 16.76 0.000

Orientat 2 5.342 5.342 2.671 2.10 0.127

Conditio*Main 1 18.169 18.169 18.169 14.32 0.000

Conditio*Orientat 2 3.236 3.236 1.618 1.27 0.284

Main*Orientat 2 1.357 1.357 0.678 0.53 0.588

Conditio*Main*Orientat 2 0.495 0.495 0.248 0.20 0.823

Erreur 110 139.611 139.611 1.269

Total 143 221.142

 

Interprétez ensuite ce tableau : quels sont les facteurs, ou les interactions, dont les effets sont significatifs ?

 

Retrouve-t-on ainsi ce qui a été obtenu, par d'autres moyens, dans l'énoncé 33 de la fiche de TD de statistiques ?