ANOVA (Analyse de la variance)

ANOVA signifie Analysis Of Variance. ANOVA a été fondée par Ronald Fisher en 1918. Le nom Analysis Of Variance a été dérivé basé sur l'approche dans laquelle la méthode utilise la variance pour déterminer les moyennes si elles sont différentes ou égales.

Il s'agit d'une méthode statistique utilisée pour tester les différences entre deux ou plusieurs moyennes. Il est utilisé pour tester des différences générales plutôt que des différences spécifiques entre les moyennes. Il évalue l'importance d'un ou plusieurs facteurs en comparant les moyennes des variables de réponse à différents niveaux de facteurs.

L'hypothèse nulle indique que toutes les moyennes de population sont égales. L'hypothèse alternative prouve qu'au moins une moyenne de population est différente

Il fournit un moyen de tester différentes hypothèses nulles en même temps.

Objectif général de l'ANOVA

La raison de réaliser l'ANOVA est de voir s'il existe une différence entre les groupes sur une variable. Aujourd'hui, les chercheurs utilisent l'ANOVA de plusieurs façons. L'utilisation de l'ANOVA dépend totalement de la conception de la recherche.

Vous pouvez utiliser le test t pour comparer les moyennes de deux échantillons, mais lorsqu'il y a plus de deux échantillons à comparer, l'ANOVA est la meilleure méthode à utiliser.

Hypothèses d'ANOVA

Il y a quatre hypothèses principales

  • Les valeurs attendues des erreurs sont nulles
  • Les variances de toutes les erreurs sont égales les unes aux autres
  • Les erreurs sont indépendantes
  • Ils sont normalement distribués

Types d'ANOVA

  1. Aller simple entre les groupes

L'ANOVA unidirectionnelle est utilisée pour vérifier s'il existe une différence significative entre les moyennes de trois groupes indépendants ou plus. Il teste principalement l'hypothèse nulle.

H₀: µ₁ = µ₂ = µ₃ =… .. = µₓ

Où µ signifie la moyenne du groupe et x signifie le nombre de groupes. One Way ANOVA donne un résultat significatif. L'ANOVA à sens unique est une statistique de test omnibus et elle ne vous permettra pas de savoir quels groupes spécifiques étaient différents les uns des autres. Afin de connaître le ou les groupes spécifiques qui diffèrent des autres, vous devez effectuer un test post hoc.

Exemple d'ANOVA unidirectionnelle

20 personnes sont sélectionnées pour tester l'effet de cinq exercices différents. 20 personnes sont réparties en 4 groupes de 5 membres chacun. Leurs poids sont enregistrés après quelques jours. L'effet des exercices sur les 5 groupes d'hommes est comparé. Ici, le poids est le seul facteur.

Hypothèses

La variable dépendante est normalement distribuée dans chaque groupe

Il y a homogénéité des variances

Indépendance des observations

  1. Mesures répétées de l'ANOVA à sens unique

Les mesures répétées ANOVA sont plus ou moins égales à One Way ANOVA mais utilisées pour les regroupements complexes. Des mesures répétées étudient les 1. changements dans les scores moyens sur trois points de temps ou plus

2. différences dans les scores moyens dans différentes conditions.

Exemple de mesures répétées

Vous pourriez rechercher l'effet d'un programme d'exercice de 6 mois sur la perte de poids chez certaines personnes. Vous calculez le poids à trois moments différents au cours de la période d'entraînement pour développer un parcours temporel pour tout effet d'exercice.

Vous pourriez faire plaisir à la même personne de manger différents types d'aliments de réduction de poids et de les évaluer selon le goût.

Dans cet exemple, le même ensemble de personnes est mesuré plusieurs fois sur la même variable dépendante.

  1. Deux voies entre les groupes

L'ANOVA bidirectionnelle compare la différence moyenne entre les groupes qui ont été divisés sur deux facteurs. L'objectif principal d'une ANOVA bidirectionnelle est de savoir s'il existe une interaction entre les deux variables indépendantes sur les variables dépendantes. Il vous permet également de savoir si l'effet d'une de vos variables indépendantes sur la variable dépendante est le même pour toutes les valeurs de votre autre variable indépendante.

Exemple

La recherche de l'effet des engrais sur le rendement du riz. Vous appliquez cinq engrais de qualité différente sur cinq parcelles de terre, chacune cultivant du riz. Le rendement de chaque parcelle de terrain est enregistré et la différence entre chaque parcelle est observée. Ici, l'effet de la fertilité des parcelles peut également être étudié. Il y a donc deux facteurs, l'engrais et la fertilité.

Hypothèses

Avant de commencer avec votre ANOVA bidirectionnelle, vos données doivent passer par six hypothèses pour vous assurer que les données dont vous disposez sont suffisantes pour effectuer l'ANOVA bidirectionnelle. Les six hypothèses sont énumérées ci-dessous

  • Votre variable dépendante doit être mesurée au niveau continu
  • Vos deux variables indépendantes doivent contenir deux ou plusieurs groupes indépendants catégoriels pour chaque
  • Vous devez avoir une indépendance d'observation
  • Évitez les valeurs aberrantes
  • Votre variable dépendante doit être normalement distribuée pour chaque combinaison des groupes des deux variables indépendantes
  • Homogénéité des variances
  1. Mesures répétées bidirectionnelles

La répétition bidirectionnelle mesure les différences moyennes entre les groupes qui ont été divisés en deux au sein des variables indépendantes. Une mesure répétée à deux voies est souvent utilisée dans la recherche où une variable dépendante est mesurée plus de deux fois dans deux conditions ou plus.

Exemple

Un chercheur en santé veut trouver le meilleur moyen de réduire les douleurs articulaires chroniques subies par les gens. Le chercheur sélectionne deux types de traitements différents pour réduire le niveau de douleur. Les deux types de traitements sont appelés «conditions». Le traitement A est un programme de massage et le traitement B est un programme d'acupuncture. Les deux traitements sont administrés à tous les patients pendant 8 semaines.

Les patients sont testés à trois moments - au début du programme, au milieu du programme et à la fin du programme.

Le chercheur sélectionne 30 patients pour participer à la recherche. Mais lorsque les 15 premiers patients subissent le traitement A, les 15 autres patients subissent le traitement B et vice versa.

Au bout de 8 semaines, le chercheur utilise des mesures répétées bidirectionnelles ANOVA pour savoir s'il y a un changement dans la douleur suite à l'interaction entre le type de traitement et à quel moment.

Hypothèses

Vos données doivent passer cinq hypothèses qui sont nécessaires pour une mesure répétée bidirectionnelle ANOVA pour donner le résultat exact.

  • Votre variable dépendante doit être mesurée au niveau continu
  • Vos deux facteurs au sein du sujet doivent être constitués d'au moins deux groupes liés catégoriquement
  • Il ne devrait pas y avoir de valeurs aberrantes
  • La variable dépendante doit être normalement répartie entre chaque combinaison des groupes liés
  • Les variances des différences entre toutes les combinaisons de groupes apparentés doivent être égales

Test ANOVA paramétrique et non paramétrique

Si l'information sur la population est entièrement connue au moyen de ses paramètres, le test statistique effectué est appelé test paramétrique.

Si les informations sur la population ou les paramètres ne sont pas connues mais qu'elles sont néanmoins nécessaires pour tester l'hypothèse, elles sont appelées test non paramétrique.

Lorsque vous avez des données catégoriques, vous ne pouvez pas utiliser la méthode ANOVA, vous devez utiliser le test du chi carré qui traite de l'interaction ANOVA.

Procédure de test d'hypothèse - ANOVA unidirectionnelle

  1. Vérifier toute hypothèse nécessaire et écrire une hypothèse nulle et alternative

Pour effectuer une ANOVA à sens unique, certaines hypothèses doivent être présentes. Les hypothèses sont les suivantes

  • Chaque échantillon est un échantillon aléatoire indépendant
  • La distribution de la variable de réponse suit une distribution normale
  • Les variances de la population sont égales d'une réponse à l'autre au niveau du groupe. On peut le découvrir en divisant l'écart type de l'échantillon le plus grand par le plus petit échantillon standard et il n'est pas supérieur à deux, puis supposons que les variances de la population sont égales.
  1. Calculer une statistique de test appropriée

L'ANOVA à sens unique utilise les statistiques du test F. Les calculs manuels nécessitent de nombreuses étapes pour calculer le rapport F, mais un logiciel statistique comme SPSS calculera le rapport F pour vous et produira le tableau source ANOVA.

Le tableau ANOVA vous donnera des informations sur la variabilité entre les groupes et au sein des groupes. Le tableau vous donnera toute la formule. Voici l'exemple d'une table ANOVA unidirectionnelle

La sourceSSDFMMEF
TraitementsSSTk-1SST / (k-1)MST / MSE
ErreurSSENkSSE / (Nk)
Total (corrigé)SSN-1

SST signifie Somme des carrés de traitements, SSE signifie Somme des carrés d'erreurs

DFT qui est k-1 signifie degrés de liberté pour le traitement, DFE qui est Nk signifie degrés de liberté pour les erreurs.

  1. Déterminer la valeur ap associée à la statistique de test
  2. Déterminer entre l'hypothèse nulle et alternative

Si l'hypothèse nulle est fausse, alors MST devrait être plus grand que MSE

  1. Donner une conclusion

Sur la base de votre résultat, écrivez une conclusion selon votre question de recherche anova.

Tests de comparaison multiples

Si vous constatez qu'il existe une différence significative entre les groupes qui n'est pas liée à une erreur d'échantillonnage, il est nécessaire d'exécuter plusieurs tests t pour tester les moyennes entre les groupes. Plusieurs tests sont effectués pour contrôler le taux d'erreur de type un.

  • Test de Scheffe
  • Test de Bonferroni modifié
  • Test de Dunnette
  • Le test de Tukey

Calculs

Les calculs d'ANOVA peuvent être effectués de trois manières: calculs manuels, feuille Excel et logiciel SPSS. Permet d'en savoir plus sur tous les calculs en détail ci-dessous

  1. Calculs manuels de l'ANOVA

  • Étape 1

Calculer CM

CM = (Total de toutes les observations) 2 / N Total

  • Étape 2

Calculez le SS total

SS total = somme des carrés de toutes les observations - CM

  • Étape 3

Calculer le SST (somme des carrés pour le traitement)

SST = ∑ 3 i = 1 T2i / n i - CM

  • Étape 4

Calculer SSE (somme des carrés pour les erreurs)

SSE = SS (Total) - SST

  • Étape 5

Calculer MST, MSE et leur ratio F

MST = SST / k-1

MSE = SSE / Nk

F = MST / MSE

  1. ANOVA avec Excel

Pour effectuer une ANOVA à facteur unique dans Excel, suivez ces étapes simples

  • Accédez à l'onglet Données
  • Cliquez sur Analyse des données
  • Sélectionnez Anova: facteur unique et cliquez sur OK (il existe également d'autres options comme Anova: deux facteurs avec réplication et Anova: deux facteurs sans réplication)
  • Cliquez sur la zone Plage d'entrée et sélectionnez la plage
  • Cliquez sur la zone Plage de sortie et sélectionnez la plage de sortie et cliquez sur OK
  • Vous obtiendrez le résultat affiché dans la feuille Excel
  • Si F est supérieur à F crit, l'hypothèse nulle est rejetée
  1. ANOVA utilisant SPSS

Téléchargez d'abord le logiciel SPSS pour effectuer l'ANOVA. Ici, nous pouvons voir comment effectuer une ANOVA unidirectionnelle à l'aide de SPSS

SPSS suppose toujours que la variable indépendante est représentée numériquement. Dans l'exemple de jeu de données, MAJOR est une chaîne. Convertissez donc d'abord la variable chaîne en une variable numérique. Une fois votre conversion terminée, vous êtes prêt à faire l'ANOVA

  • Ouvrez le logiciel SPSS
  • Cliquez sur Analyser à Comparer les moyens à ANOVA unidirectionnelle
  • La boîte de dialogue ANOVA à sens unique apparaît à l'écran
  • Sur le côté gauche de la boîte de dialogue, vous verrez une liste de toutes les variables dépendantes que vous avez mesurées. Déplacez-le dans la liste des personnes à charge sur le côté droit en utilisant le bouton fléché supérieur
  • De la même manière, déplacez la variable indépendante dans la liste de gauche vers la zone Facteur sur le côté droit.
  • Cliquez sur le bouton Post Hoc pour sélectionner le type de comparaison multiple que vous souhaitez faire.
  • Sélectionnez tout test post hoc qui convient à votre recherche en cliquant sur la case à côté du test
  • Cliquez sur Continuer et vous accédez à la boîte de dialogue ANOVA unidirectionnelle
  • Sélectionnez les statistiques et cliquez sur les cases à cocher à gauche de l'option pour les sélectionner
  • Cliquez sur Tracé des moyennes pour obtenir un graphique anova des moyennes des conditions
  • Cliquez sur Continuer et sur OK

La fenêtre de sortie SPSS apparaîtra avec six sections principales

  • Section descriptive
  • Test d'homogénéité des variances
  • ANOVA
  • Comparaisons multiples
  • Moyenne pondérée cumulative
  • Graphique

Éléments à prendre en compte lors de l'exécution d'une ANOVA

Le niveau des données et les hypothèses jouent un rôle crucial dans l'ANOVA.

Le chercheur doit savoir si les données sont croisées ou imbriquées. Si les données sont croisées, tous les groupes reçoivent tous les aspects.

Si les données sont imbriquées, chaque groupe recevra une méthode ANOVA différente.

Il est plus important de calculer la taille de l'effet anova. La taille de l'effet peut vous dire dans quelle mesure l'hypothèse nulle est fausse. Une taille d'effet moyenne est toujours préférable

J'espère que cet article vous a donné un bref aperçu de l'ANOVA et l'interprétation des résultats en l'utilisant.

Cours connexes :-

  1. ANOVA avec Minitab
  2. Cours R Studio Anova Techniques

Catégorie: