Licence de Psychologie - TD No 5

Tests statistiques avec Excel - Suite

 

0 - Changement du mot de passe

Pour changer son mot de passe sur le serveur, il existe une procédure beaucoup plus simple que celle décrite dans le premier polycopié. Vous pouvez en effet procéder de la manière suivante :

1) Choisissez un "bon" mot de passe (relisez le premier polycopié de TD à ce sujet)

2) Ouvrez une session sous votre nom de login.

3) Appuyez simultanément sur les touches Ctrl+Alt+Del

4) Cliquez sur le bouton : Changer de mot de passe...

5) Dans la fenêtre de dialogue qui apparaît alors, tapez dans les champs voulus l'ancien mot de passe et le nouveau mot de passe, et sa confirmation.

Vous devez normalement recevoir le message : "Votre mot de passe a été changé".

 

1 - Comparaison de deux proportions

Deux échantillons provenant de deux populations différentes ont passé un test commun.

Dans le premier groupe, d'effectif 150, le taux de succès a atteint 68%.

Dans le deuxième groupe, d'effectif 180, le taux de succès a atteint 55,5%.

Peut-on dire que la seconde population réussit l'épreuve moins facilement que la première ?

Excel ne comporte pas de fonction spécifiquement destinée à traiter ce genre de situation. Notre démarche sera donc très voisine de celle utilisée en calcul manuel.

A

B

C

1

Groupe 1 Groupe 2

2

Effectif

150

180

3

Taux succès

68%

55.50%

 

avec

On peut aussi raisonner en termes de seuil et de valeur Z critique en utilisant la fonction LOI.NORMALE.STANDARD.INVERSE

 

A

B

C

5
Test de comparaison de proportions (unilatéral)

6
Taux de succès global : =(B3*B2+C3*C2)/(B2+C2)

7
Erreur Type au carré : =C6*(1-C6)*(1/B2+1/C2)

8
Erreur Type : =RACINE(C7)

9
Statistique Z observée : =(B3-C3)/C8

10

11
Niveau de significativité : =1-LOI.NORMALE.STANDARD(C9)

12

13
Seuil 0.01

14
Z critique =LOI.NORMALE.STANDARD.INVERSE(1-B13)

 

Le résultat du calcul devrait donner :

Test de comparaison de proportions (unilatéral)
Taux de succès global :

61.18%

Erreur Type au carré :

0.00290

Erreur Type :

0.05388

Statistique Z observée :

2.3201

Niveau de significativité :

1.0168%

Seuil

1%

Z critique

2.3263

 

Remarque : le niveau de significativité peut aussi être obtenu par la formule :

=1-LOI.NORMALE(B3-C3;0;C8;VRAI)

Lisez l'article de l'aide d'Excel donnant la signification des paramètres.

Exercice. 1) Faites varier les taux de succès dans les deux groupes. Que devient le résultat du test lorsque les taux varient ?

2) Faites varier les effectifs dans les deux groupes. Avec les taux de succès indiqués, quelles sont les tailles minimales des échantillons permettant d'obtenir un résultat significatif à 5% ?

 

2 - Tests non paramétriques

2.1 Test du signe

On veut utiliser un test du signe pour comparer les scores des enfants du groupe témoins à 6 mois et à 24 mois. Il s'agit donc, dans un premier temps, de calculer le nombre de différences non nulles et le nombre de différences négatives dans la colonne "Différence" (plage D3:D33). On peut pour cela utiliser la fonction NB.SI(). Cette fonction attend deux paramètres : une plage de cellules et une "condition". Elle renvoie en résultat le nombre de cellules de la plage qui satisfont la condition.

B

C

D
35 TEST DU SIGNE
36 Nbre de différences non nulles =NB.SI(D3:D33;"<>0")
37 Nbre de différences négatives =NB.SI(D3:D33;"<0")
38 Niveau de significativité =1- LOI.BINOMIALE(D37;D36;0,5;VRAI)
39 Valeur Critique à 5% =D36-CRITERE.LOI.BINOMIALE(D36;0,5;0,05)

 

Remarquez l'utilisation des fonctions LOI.BINOMIALE et CRITERE.LOI.BINOMIALE.

La fonction LOI.BINOMIALE calcule la fréquence b(n,p,k) de la modalité k d'une variable binomiale de paramètres n et p, ou la fréquence cumulée de la valeur k. Ses trois premiers paramètres sont, dans l'ordre, k, n et p. Le quatrième paramètre est une valeur logique.

La fonction CRITERE.LOI.BINOMIALE renvoie la valeur k critique pour laquelle la fréquence cumulée F(k) est inférieure au seuil a choisi, tandis que F(k+1) est supérieure au seuil.

L'ordre des paramètres est n, p, a .

Vous devriez obtenir comme résultats :

B

C

D
35 TEST DU SIGNE
36 Nbre de différences non nulles

31
37 Nbre de différences négatives

19
38 Niveau de significativité

7,48%
39 Valeur Critique à 5%

20

Conclusion : on n'a pas démontré de différence significative entre l'IDM à 6 mois et l'IDM à 24 mois pour la population d'où a été tiré l'échantillon d'enfants du groupe témoin.

2.2 Test de la médiane

 

On va utiliser le même fichier W:\Psy3\TD EXCEL\Enfants-PRN.xls et réaliser un test de la médiane pour comparer les IDM à 24 mois des groupes PRN expérimental et PRN témoin.

Si l'on souhaite que les résultats intermédaires soient calculés par Excel, on pourra utiliser les formules suivantes. Toutes les fonctions utilisées ici sont déjà connues. Remarquer cependant :

F

G

H

I
35 TEST DE LA MEDIANE pour IDM-24
36 Médiane =MEDIANE(C3:C33;F3:F27)
37 Observés PRN Témoin PRN expérimental Total
38 <=Médiane =NB.SI(C3:C33;"<=111,5") =NB.SI(F3:F27;"<=111,5") =SOMME(G38:H38)
39 >Médiane =NB.SI(C3:C33;">111,5") =NB.SI(F3:F27;">111,5") =SOMME(G39:H39)
40 Total =G38+G39 =H38+H39 =SOMME(G40:H40)
41
42 Niveau de significativité : =TEST.KHIDEUX(G38:H39;L38:M39)

 

K

L

M
37 Théoriques =G37 =H37
38 =F38 =G$40*$I38/$I$40 =H$40*$I38/$I$40
39 =F39 =G$40*$I39/$I$40 =H$40*$I39/$I$40

 

Nous devrions ainsi obtenir comme résultats :

 

TEST DE LA MEDIANE pour IDM-24
Médiane

111.5

Observés PRN Témoin PRN expérimental Total
<=Médiane

19

9

28

>Médiane

12

16

28

Total

31

25

56

Niveau de significativité :

5.988%

 

Remarque : Le test de la médiane ne met pas en évidence de différence entre les deux groupes. En revanche, un test unilatéral de comparaison de moyennes établit une différence au bénéfice du groupe expérimental. Mais le test de la médiane est moins puissant, et c'est nécessiarement un test bilatéral.

2.3 Protocoles de rangs

2.3.1 - La fonction RANG et le calcul des protocoles des rangs

L'utilitaire d'analyse ne comporte pratiquement pas de traitements permettant de faire des tests non paramétriques. Seul l'item Analyse de position permet de déterminer un protocole des rangs, mais sans respecter la convention du rang moyen pour les ex aequos.

La fonction d'Excel permettant de former des protocoles de rangs est la fonction RANG, dont la syntaxe, selon l'aide en ligne, est la suivante :

RANG(nombre;référence;ordre)

nombre est le nombre dont vous voulez connaître le rang.

référence est une matrice, ou une référence à une liste de nombres. Les valeurs non numériques dans référence sont ignorées.

ordre est un numéro qui spécifie comment déterminer le rang de l'argument nombre.

Si l'argument ordre a la valeur 0 (zéro) ou si cet argument est omis, Microsoft Excel calcule le rang d'un nombre comme si la liste définie par l'argument référence était triée par ordre décroissant.

Si la valeur de l'argument ordre est différente de zéro, Microsoft Excel calcule le rang d'un nombre comme si la liste définie par l'argument référence était triée par ordre croissant.

Remarque

La fonction RANG attribue le même rang aux nombres en double. Cependant, la présence de nombres en double affecte le rang des nombres suivants. Par exemple, dans une liste de nombres entiers, si le nombre 10 apparaît deux fois et porte le numéro de rang 5, le nombre 11 se verra attribuer le numéro de rang 7 (aucun nombre n'aura le rang 6).

2.3.2 Le calcul du rang moyen

On calcule ainsi le rang des sujets, classés par valeurs croissantes de la variable, en attribuant aux ex aequos le meilleur rang dans leur groupe.

On calcule ainsi le rang des sujets, toujours classés par valeurs croissantes de la variable, mais en attribuant aux ex aequos le moins bon rang dans leur groupe.

Le protocole des rangs, avec la convention du rang moyen pour les ex aequos, peut donc être obtenu de la façon suivante :

Remarque : la constante 11 de cette formule est liée au nombre de données. Elle pourrait être remplacée par l'expression : NB($A$1:$A$10)+1

2.4 - Le test de Wilcoxon Mann Whitney

On considère les deux groupes "Maison des parents" et "Famille adoptive".

Malgré la faible taille des échantillons, on peut aussi calculer la statistique obtenue en utilisant l'approximation par une loi normale.

On pourra utiliser les formules suivantes (tout en remarquant que la formule donnant l'erreur type peut tout aussi bien être entrée sous la forme =19*18^2/12/9/9):

E^2 =(NB(A2:A10)+NB(B2:B10)+1)*(NB(A2:A10)+NB(B2:B10))^2/12/NB(A2:A10)/NB(B2:B10)
Z Obs =(C12-D12)/RACINE(G9)
Seuil 0,05
Z crit =LOI.NORMALE.STANDARD.INVERSE(1-G11)

 

Vous devriez obtenir les résultats suivants :

E^2

6.33

Z Observé

1.50

Seuil

5.0%

Z critique

1.6449

 

Exercice : Procéder de même pour effectuer les autres comparaisons de groupes pris deux à deux. La seule comparaison qui nous conduit à accepter l'hypothèse alternative est la troisième : les enfants placés en foyer sont moins souvent absents que les enfants placés en famille adoptive.

2.5 - Le test de Wilcoxon

Pour utiliser le test de Wilcoxon, il nous faut déterminer le protocole des rangs signés.

Ces rangs sont reportés en colonne F si la différence est positive et en colonne G si elle est négative.

Par exemple, en nommant diff la plage D2:D21, on pourra obtenir en ligne 2 les formules suivantes :

 

D

E

F

G

1
Diff. absolue Rangs Rangs + Rangs -

2
=ABS(B2-C2) =(RANG(D2;diff;1)+NB(diff)+1-RANG(D2;diff;0))/2 =SI(B2>C2;E2;"") =SI(B2<C2;E2;"")

 

Vu la taille de l'échantillon, on peut aussi utiliser l'approximation par une loi normale.

Rappel des formules :

Soit le maximum des deux sommes de rangs. La statistique de test s'écrit :

avec

Vous devriez finalement obtenir les résultats suivants :

E^2

717.5

Z Obs

2.3706

Seuil

0.05

Z crit

1.6449

 

Exercices. Reprendre le fichier W:\PSY3\TD Excel\Enfants-PRN.xls et traiter les deux comparaisons qui ont été faites à l'aide de tests de rangs.

N.B. Vous pouvez également consulter le fichier W:\PSY3\TD Excel\Enfants-PRN-correction.xls pour vérifer vos résultats.