PSY38X2 : Traitement de données en Psychologie - TD N°3

Utilisation d'un logiciel de traitement statistique : Minitab

 

 

1) Qu'est-ce que Minitab ?

Minitab est un logiciel de traitements statistiques. A la différence de progiciels tels que Word ou Excel (progiciels de fonction), Minitab est dédié à une tâche bien précise : le traitement de données statistiques. Il en résulte que son utilisation pose peu de problèmes conceptuels au niveau informatique... et de nombreux problèmes d'ordre statistique, d'autant que le nombre et la variété des méthodes proposées peuvent dérouter certains...

Comparé à d'autres produits analogues, Minitab est un logiciel complet et puissant. En revanche, il n'est pas toujours simple de se guider dans les menus des différents traitements proposés et dans leurs options.

L'espace de travail de Minitab

Au démarrage, l'écran se compose d'une fenêtre "Feuille de travail" et d'une fenêtre "Session". D'autres fenêtres peuvent être affichées à la demande : par exemple les fenêtres "Informations" et "Historique".

La fenêtre "Feuille de travail" sert essentiellement à saisir les données qui feront l'objet de traitement. La fenêtre "Session" affiche les résultats des traitements. D'autres fenêtres pourront être créées en cours de travail : fenêtres graphiques, autres feuilles de données, etc.

 

2) Statistiques descriptives. Corrélation et régression

2.1. Enoncé d'un cas :

Dans une expérience de perception, on étudie l'évaluation des longueurs de figures géométriques. Le sujet est invité à évaluer les longueurs des figures, en s'aidant d'une figure de référence dont il connaît la longueur (9 cm).

Dans la condition 1, les figures sont 11 bâtonnets. Les données recueillies pour un sujet sont les suivantes :

Longueur

2.5

4.6

6.3

7.6

8.5

9.0

9.5

10.4

11.7

13.4

15.5

Eval. long.

2.8

4.4

6.2

7.8

8.2

9.0

9.6

10.6

12.0

13.6

15.2

Dans la condition 2, les figures sont des cercles de périmètres égaux aux longueurs des bâtonnets de la condition 1. L'évaluation du périmètre par un sujet est alors la suivante :

Périmètre

2.5

4.6

6.3

7.6

8.5

9.0

9.5

10.4

11.7

13.4

15.5

Eval. périm.

1.8

3.6

5.8

7.2

8.4

9.0

9.8

11.0

13.2

16.1

21

Ouvrir un nouveau projet Minitab et saisir les données dans quatre variables : Longueur, Eval. Longueur, Périmètre, Eval. Périm. La troisième pourra évidemment être recopiée à partir de la première.

 

2.2 Statistiques descriptives

Calculer les paramètres de statistiques descriptives des 4 variables (menu Stat - Statistiques Elémentaires - Afficher les statistiques descriptives).

 

2.3 Représentations graphiques

Réaliser un histogramme pour la variable "Longueur". On choisira un découpage en 4 classes.

(Menu Graphiques - Histogramme, puis le bouton Options et enfin dans le groupe de réglages "Définition des intervalles", indiquer : Nombre d'intervalles = 4.

2.4 Covariance et coefficient de corrélation

Les méthodes de corrélation et de régression linéaires sont bien adaptées à l'étude de la situation proposée. Calculer les covariances et les coefficients de corrélation des couples (Longueur, Eval. Long.) d'une part, (Périmètre, Eval. Périmètre) d'autre part. Utiliser pour cela les menus Stat - Statistiques Elémentaires - Covariance... et Stat - Statistiques Elémentaires - Corrélation.

Remarquer que, pour la covariance, Minitab fournit un résultat du type suivant :

Covariances

Longueur Eval Lon

Longueur 14.2220

Eval Lon 14.1360 14.1025

Autrement dit, Minitab calcule les covariances de tous les couples de variables formés à partir des variables fournies, la covariance du couple (Longueur, Longueur), par exemple étant, bien entendu, la variance de la variable Longueur.

 

2.5 Régression linéaire

Pour les variables Longueur et Eval. Long., on souhaite étudier si le modèle

Eval. Long = Longueur

constitue un bon modèle des données observées. Pour cela, on va rechercher une équation de la droite de régression de Eval. Long. par rapport à Longueur en imposant à cette droite de passer par l'origine :

Menu Stat - Régression -Régression ...

Ouvrir le dialogue Options... et désactiver la case "Ajuster l'ordonnée à l'origine".

On obtient ainsi comme équation de régression :

Eval. Long. = 1.00 Longueur.

Le menu Stat - Droite d'ajustement... permet d'obtenir le nuage de point et la droite d'ajustement sur un graphique (mais il ne s'agit plus exactement de la droite "passant par l'origine") :

Procéder de même pour les variables Périmètre et Eval. Périm. mais en ayant soin de réactiver la case "Ajuster l'ordonnée à l'origine". On obtiendra :

L'équation de régression est

Eval-Périm. = - 3.31 + 1.45 Périmètre

2.6 Corrélation linéaire à plusieurs variables

Ouvrir le fichier W:\PSY3\TD-Minitab\Eval-Cours.MPJ. Il rassemble les données figurant dans l'exercice 8 des fiches de TD de Statistiques. L'énoncé accompagnant ces données est rappelé au début de la fenêtre Session.

- Calculer les paramètres descriptifs des six variables.

- Calculer les coefficients de corrélation des variables prises deux à deux.

Quels sont les couples de variables pour lesquels la corrélation est significative, au seuil de 5% ?

- On veut estimer la variable Qual-Glob en utilisant comme prédicteurs les 5 autres variables.

Déterminer l'équation de régression et le coefficient de corrélation (menu Stat - Régression - Régression). Vous devriez obtenir :

L'équation de régression est

Qual-Glob = - 1.19 + 0.763 Pédagogie + 0.132 Examen +

0.489 Connaissance - 0.184 Résultat +0.000525 Inscription

S = 0.3202 R-carré = 75.5% R-carré (ajus) = 72.8%

Utilisez le bouton "Stockage" pour créer une nouvelle colonne donnant les valeurs ajustées de la variable Qual-Glob. On peut alors visualiser la qualité de l'ajustement en construisant une droite d'ajustement entre les variables AJUST et Qual-Glob :

3) Comparaison de moyennes avec Minitab

Ouvrir le fichier W:\PSY3\TD Minitab\Loftus.MPJ. Ce fichier contient les données de l'exercice N° 14 de la fiche de TD de statistiques. Une partie de l'énoncé est fournie au début de la fenêtre "Session".

Observez la façon dont les données ont été saisies : nous aurons besoin des deux premières colonnes pour faire une analyse de variance à un facteur, et des autres colonnes pour faire des comparaisons de moyennes ou de variances.

A l'aide du menu Stat - Statistiques élémentaires - Test t à 2 échantillons..., comparer les moyennes

des résultats obtenus avec HIT et des résultats obtenus avec SMASH.

Activez la boîte à cocher "Assumer des variances égales". Choisissez également l'un des item de la liste déroulante "Alternative" selon le type de test (unilatéral ou bilatéral) souhaité.

Affichez également le dialogue "Graphiques" et demandez l'affichage d'un graphique de type "Boîte à moustaches".

Minitab fournit le résultat suivant :

mu du test t HIT = mu SMASH (en fonction de non =): T = -3.26 P = 0.0043 DL = 18

Les deux utilisent Ecart-type de regroupement = 7.88

De cette phrase - pas forcément claire -, on retiendra que Tobs= -3.26, ce qui correspond à un niveau de significativité de 0.43% pour un test bilatéral. Rappelez-vous le lien qui existe entre niveau de significativité et seuil :

- Si Niv Sig < Seuil, on retient l'hypothèse alternative H1

- Si Niv Sig > Seuil, on retient l'hypothèse nulle H0.

Interprétez également le graphique produit par Minitab.

Remarque. Essayez également d'exécuter le test sans activer l'option "variances égales". Dans ce cas, la valeur de la statistique observée est la même. En revanche, le nombre de degrés de liberté est alors de 15.

 

4) Comparaison de variances avec Minitab

On souhaite comparer les variances des séries observées pour HIT et pour SMASH (par exemple, pour savoir si le choix fait dans le test précédent était légitime). Mais, pour obtenir un test limité à ces deux niveaux du facteur "Verbe", il nous faut créer deux nouvelles colonnes de données : la colonne C10 contiendra la valeur du facteur "Verbe" (HIT ou SMASH), la colonne C11, la valeur correspondante du facteur "Vitesse".

Affichez la feuille de travail. Copiez les 20 premières lignes des colonnes C1 et C2 et recopiez-les à partir de la première ligne de la colonne C10.

Utilisez ensuite le menu Stat - ANOVA - Test de comparaison de la variance... en complétant la fenêtre de dialogue comme suit :

Parmi les résultats affichés par Minitab, on trouve :

Test F (loi normale)

Statistique du test: 2.285

Niveau de P: 0.234

D'après ce résultat, nous pouvons accepter ici l'hypothèse nulle d'égalité des variances des deux séries.

Remarque. Minitab permet aussi de tester l'égalité des variances de l'ensemble des 5 groupes. Mais les tests proposés n'ont pas été vus en cours de statistiques.

5) Analyse de variance à 1 facteur

On se propose de comparer les 5 groupes des données Loftus et effectuant une analyse de variance. En toute rigueur, on s'est assuré au préalable de l'homogénéïté des variances et de la normalité des distributions (menu Stat - Statistiques Elémentaires - Test de Normalité...).

Utilisez le menu Stat - ANOVA - A un facteur contrôlé.... Complétez la fenêtre de dialogue comme suit :

A l'aide du bouton "graphiques", demandez aussi la composition d'un graphique en "boîtes à moustaches" pour les données.

Minitab fournit le tableau d'analyse de variance suivant :

Analyse de variance pour Vitesse

Source DL SC CM F P

Verbe 4 1256.5 314.1 4.06 0.007

Erreur 45 3481.0 77.4

Total 49 4737.5

Le graphique permet de situer les variables les unes par rapport aux autres :

Remarque : L'analyse de variance peut aussi être réalisée à partir des données saisies dans les colonnes C4 à C8. Mais il faut alors sélectionner le menu Stat - ANOVA - A un facteur contrôlé (désempilé)...

6. Monitorat

6.1 Statistiques descriptives et corrélation

Le fichier W:\PSY3\TD-Minitab\Tailles.MPJ rassemble les données de l'exercice 4 de la fiche de TD de statistiques.

Calculer les paramètres de statistiques descriptives de chacune des trois séries de données, puis les covariances des variables prises deux à deux.

Déterminer l'équation du plan de régression de la variable Z par rapport aux variables X et Y.

Calculer le coefficient de corrélation global.

Donner la prédiction de la taille Z lorsque X=188 et Y=171.

A l'aide des items de menu Copier et Coller, transférez les résultats obtenus dans Word et rédigez un rapport de l'étude qui a été faite.

N.B. Les résultats obtenus pourront être comparés à ceux fournis en réponse dans la fiche de TD de statistiques.

 

6.2 Test du khi-2

Lors de l'analyse des réponses à un questionnaire, on a obtenu par tri croisé le tableau de contingence suivant :

 

Accord

Désaccord

Hommes

139

42

Femmes

158

27

Saisissez ce tableau de contingence dans trois colonnes d'une feuille de calcul Minitab.

N.B. La première de ces colonnes sera de type "texte". Les deux autres, de type numérique, seront nommées Accord et Désaccord :

Utilisez le menu Stat - Tableaux - Test du khi deux pour effectuer un test du khi-2 sur ce tableau de contingence. Vous devriez obtenir :

Accord Désaccor Total

1 139 42 181

146.88 34.12

2 158 27 185

150.12 34.88

Total 297 69 366

Khi deux = 0.422 + 1.818 + 0.413 + 1.779 = 4.433

DL = 1, P = 0.035

6.3 Analyse de variance

Ouvrez sous Minitab le fichier W:\PSY3\TD-Minitab\Bransfor.MPJ.

Ce fichier contient l'énoncé et les données de l'exercice 13 de loa fiche de TD de statistiques.

Vérifiez à l'aide de Minitab les différents résultats indiqués sur la fiche de TD (sommes par groupe, tableau d'analyse de variance, etc).