Présentation de l'ANOVA bidirectionnelle en R
L'ANOVA bidirectionnelle (analyse de la variance) nous aide à comprendre la relation entre une variable dépendante continue et deux variables indépendantes catégorielles. Dans cette rubrique, nous allons en savoir plus sur l'ANOVA bidirectionnelle dans R.
Voici l'hypothèse d'intérêt sous ANOVA bidirectionnelle
- H₀: Appelez-le l'effet principal qui est le premier facteur dépendant de la variable continue
- H₀: l'effet principal concerne également l'effet sur la deuxième variable de la variable continue dépendante.
- H₀: L' interaction est l'effet combiné de la première variable du deuxième facteur sur la variable dépendante
Voici les normes qu'une ANOVA bidirectionnelle doit satisfaire.
- Les observations doivent être indépendantes
- Les observations doivent être normalement distribuées.
- Il devrait y avoir une variance égale dans les observations
- Pas de valeurs aberrantes dans la conception
- Les erreurs doivent être indépendantes.
Remarque
Nous devons transformer nos données si la normalité et la variance égale sont violées.
Exemple d'ANOVA bidirectionnelle dans R
Réalisons un test ANOVA unidirectionnel sur l'ensemble de données sur les niveaux de cancer qui contient 48 lignes et 3 variables de données:
Temps pris: temps de survie d'un animal
Différents niveaux de cancer 1 - 3
Traitement: Traitements utilisés de 1 à 3
Avant de tester, nous avons besoin des données suivantes en main.
- Importer les données
- Supprimer la variable inutile
- Convertissez les variables (niveaux de cancer) en niveau ordonné.
Voici l'ensemble de données.
Observations: 48
Variables: 3
temps de survie 0, 31, 0, 45, 0, 46, 0, 43, 0, 36, 0, 29, 0, 40, 0, 23, 0, 22, 0…
niveaux de cancer 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2…
Traitement A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …
Objectifs
- H₀: pas de changement du temps de survie moyen entre les groupes
- H₀: le temps de survie est différent pour au moins un groupe.
Pas
- Vérifiez les niveaux de cancer. Nous pouvons voir trois valeurs de caractères parce que nous les convertissons en facteurs avec un verbe muté.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Calculer à la fois la moyenne et l'écart type
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
Production:
Un tibble: 3 x 4
cancerlevels count_cancerlevels mean_time sd_time
1 1 16 0, 617500 0, 20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0, 276250 0, 06227627
- À l'étape trois, vous pouvez vérifier graphiquement s'il existe une différence entre les distributions. Notez que vous incluez le point instable.
- Exécutez le test avec la commande AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Syntaxe:
y ~ X1 + X2 +… + Xn (X1 + X2 +… fait référence aux variables indépendantes)
y ~. Utiliser toutes les variables restantes comme variables indépendantes
Assurez-vous d'enregistrer le modèle et d'imprimer le résumé.
Code
- aov (time ~ cancerlevels, data = df): Exécutez le test ANOVA avec la formule suivante
- summary (anova_one_way): imprimer le résumé du test
Df Sum Sq Valeur moyenne Sq F Pr (> F)
Niveaux de cancer 2 1, 033 0, 5165 11, 79 7, 66e-05 ***
Résidus 45 1, 972 0, 0438
-
Signif. codes: 0 '***' 0, 001 '**' 0, 01 '*' 0, 05 '.' 0, 1 '' 1
La valeur de p est inférieure au seuil de 0, 05. La différence statistique est indiquée par '*' dans le cas ci-dessus.
Test unidirectionnel vers Anova bidirectionnel en R
Voyons comment le test unidirectionnel peut être étendu à l'ANOVA bidirectionnelle. Le test est similaire à l'ANOVA unidirectionnelle, mais la formule diffère et ajoute une autre variable de groupe à la formule.
y = x1 + x2
- H0 : Les moyennes sont égales pour les deux variables (variables factorielles)
- H3 : Les moyennes sont différentes pour les deux variables
Vous ajoutez des variables de traitement à notre modèle. Cette variable indique le traitement administré au patient. Vous souhaitez savoir s'il existe une dépendance statistique entre les niveaux de cancer et le traitement administré au patient.
Nous ajustons notre code en ajoutant un régal avec l'autre variable indépendante.
Df Sum Sq Valeur moyenne Sq F Pr (> F)
Niveaux de cancer 2 1, 0330 0, 5165 20, 64 5, 7e-07 ***
Traiter 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***
Résidus 42 1, 0509 0, 0250
Les niveaux de cancer et le traitement sont tous deux statistiquement différents de 0. Par cela, nous pouvons rejeter l'hypothèse NULL. Confirmez également que la modification du traitement ou du type de cancer a une incidence sur la durée de survie.
Tester
ANOVA unidirectionnelle: H3- La moyenne est différente pour au moins un groupe
ANOVA bidirectionnelle: H3- La moyenne est différente pour les deux groupes.
Différence entre l'ANOVA unidirectionnelle et bidirectionnelle
Différences entre l'ANOVA unidirectionnelle et l'ANOVA bidirectionnelle
ANOVA unidirectionnelle | ANOVA bidirectionnelle |
Conçu pour permettre le test d'égalité entre 3 ou plusieurs moyens | Conçu pour évaluer l'interrelation de deux variables indépendantes sur une variable dépendante. |
Implique une variable indépendante | Implique deux variables indépendantes |
Analysé en 3 groupes catégoriels ou plus. | Compare plusieurs groupes de deux facteurs |
Doit satisfaire deux principes: la réplication et la randomisation | Doit satisfaire trois principes qui sont la réplication, la randomisation et le contrôle local. |
Avantages de l'ANOVA bidirectionnelle
- Dans l'exemple ci-dessus, l'âge et le sexe dans notre exemple - aident à réduire la variation d'erreur, ce qui rend la conception plus efficace.
- L'ANOVA bidirectionnelle nous permet de tester l'effet de deux facteurs en même temps.
Applications de l'ANOVA
- Comparaison du kilométrage de différents véhicules, carburant et types de routes.
- Connaître l'impact de la température, de la pression ou de la concentration chimique sur certaines réactions chimiques (réacteurs de puissance, usines chimiques, etc.)
- Impact de différents catalyseurs sur les vitesses de réaction chimique
- Comprendre l'impact des publicités et des différents nombres de réponses des clients.
- Impact des performances, de la qualité et de la rapidité de fabrication en biologie (processus basé sur le nombre de cellules dans lesquelles elles sont divisées)
Articles recommandés
Ceci est un guide de l'ANOVA bidirectionnelle dans R. Ici, nous discutons des exemples, objectifs, étapes et différence entre l'ANOVA unidirectionnelle et bidirectionnelle. Vous pouvez également consulter les articles suivants pour en savoir plus -
- ANOVA en R
- Comment interpréter les résultats à l'aide du test ANOVA
- Régression vs ANOVA
- GLM dans R