Formule des valeurs aberrantes (table des matières)

  • Formule des valeurs aberrantes
  • Exemples de formule de valeurs aberrantes (avec modèle Excel)

Formule des valeurs aberrantes

En statistiques, les valeurs aberrantes sont les deux points inhabituels extrêmement distants dans les ensembles de données donnés. La valeur extrêmement élevée et les valeurs extrêmement faibles sont les valeurs aberrantes d'un ensemble de données. Ceci est très utile pour trouver tout défaut ou erreur qui s'est produit. Tout simplement comme son nom l'indique, les valeurs aberrantes sont des valeurs qui se trouvent à l'extérieur du reste des valeurs de l'ensemble de données. Par exemple, considérez les étudiants en génie et imaginez qu'ils avaient des nains dans leur classe. Les nains sont donc les gens qui sont extrêmement bas en taille par rapport aux autres personnes de taille normale. C'est donc la valeur aberrante dans cette classe. Les valeurs aberrantes peuvent être calculées en utilisant la méthode de Tukey.

La formule pour les valeurs aberrantes -

Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)

Exemples de formule de valeurs aberrantes (avec modèle Excel)

Prenons un exemple pour mieux comprendre le calcul de la formule des valeurs aberrantes.

Vous pouvez télécharger ce modèle de valeurs aberrantes ici - Modèle de valeurs aberrantes

Formule des valeurs aberrantes - Exemple # 1

Tenez compte de l'ensemble de données suivant et calculez les valeurs aberrantes pour l'ensemble de données.

Ensemble de données = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23

Ordre croissant de l'ensemble de données:

La médiane de l'ensemble de données d'ordre croissant est calculée comme suit:

Dans cet ensemble de données, le nombre total de données est 11. Donc n = 11. Médiane = 11 + 1/2 = 12/2 = 6. Par conséquent, la valeur qui est en 6ème position dans cet ensemble de données est la médiane.

Valeur médiane = 34.

Divisez l'ensemble de données en 2 moitiés à l'aide de la médiane.

La médiane de l'ensemble de données de la moitié inférieure et de la moitié supérieure est calculée comme suit:

  • Dans la moitié inférieure 2, 5, 6, 7, 23, si nous trouvons la médiane comme celle que nous avons trouvée à l'étape 2, la valeur médiane serait 6. Donc Q1 = 6.
  • Dans la moitié supérieure 45, 56, 89, 98 309, si nous trouvons la médiane comme celle que nous avons trouvée à l'étape 2, la valeur médiane serait 89. Donc Q3 = 89.

L'IQR est calculé en utilisant la formule donnée ci-dessous

IQR = Q3 - Q1

  • IQR = 89 -6
  • IQR = 83

La valeur aberrante inférieure est calculée à l'aide de la formule ci-dessous

Valeur aberrante inférieure = T1 - (1, 5 * IQR)

  • Valeur aberrante inférieure = 6 - (1, 5 * 83)
  • Valeur aberrante inférieure = -118, 5

Une valeur aberrante plus élevée est calculée à l'aide de la formule ci-dessous

Valeur aberrante supérieure = Q3 + (1, 5 * IQR)

  • Valeur aberrante supérieure = 89 + (1, 5 * 83)
  • Valeur aberrante supérieure = 213, 5

Récupérez maintenant ces valeurs dans l'ensemble de données -118, 5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213, 5, 309. Valeurs qui tombent en dessous dans la valeur du côté inférieur et au-dessus dans le côté supérieur sont la valeur aberrante. Pour cet ensemble de données, 309 est la valeur aberrante.

Formule des valeurs aberrantes - Exemple # 2

Tenez compte de l'ensemble de données suivant et calculez les valeurs aberrantes pour l'ensemble de données.

Ensemble de données = 45, 21, 34, 90, 109.

Ordre croissant de l'ensemble de données:

La médiane de l'ensemble de données d'ordre croissant est calculée comme suit:

Dans cet ensemble de données, le nombre total de données est 5. Donc n = 5. Médiane = 5 + 1/2 = 6/2 = 3. Par conséquent, la valeur qui est en 3e position dans cet ensemble de données est la médiane.

Valeur médiane = 45.

Divisez l'ensemble de données en 2 moitiés à l'aide de la médiane.

La médiane de l'ensemble de données de la moitié inférieure et de la moitié supérieure est calculée comme suit:

  • Q1 = 27, 5
  • Q3 = 89

L'IQR est calculé en utilisant la formule donnée ci-dessous

IQR = Q3 - Q1

  • IQR = 99, 5 - 27, 5
  • IQR = 72

La valeur aberrante inférieure est calculée à l'aide de la formule ci-dessous

Valeur aberrante inférieure = T1 - (1, 5 * IQR)

  • Valeur aberrante inférieure = 27, 5 - (1, 5 * 72)
  • Valeur aberrante inférieure = -80, 5

Une valeur aberrante plus élevée est calculée à l'aide de la formule ci-dessous

Valeur aberrante supérieure = Q3 + (1, 5 * IQR)

  • Valeur aberrante supérieure = 99, 5 + (1, 5 * 72)
  • Valeur aberrante supérieure = 207, 5

Explication

Étape 1: Organisez toutes les valeurs dans l'ensemble de données donné dans l'ordre croissant.

Étape 2: recherchez la valeur médiane des données triées. La médiane peut être trouvée en utilisant la formule suivante. Le calcul suivant vous donne simplement la position de la valeur médiane qui réside dans l'ensemble de dates.

Médiane = (n + 1) / 2

Où n est le nombre total de données disponibles dans l'ensemble de données.

Étape 3: Trouvez la valeur quartile inférieure Q1 dans l'ensemble de données. Pour trouver cela, en utilisant la valeur médiane, divisez l'ensemble de données en deux moitiés. À partir du demi-ensemble inférieur de valeurs, trouvez la médiane de cet ensemble inférieur qui est la valeur Q1.

Étape 4: Trouvez la valeur du quartile supérieur Q3 dans l'ensemble de données. C'est exactement comme l'étape ci-dessus. Au lieu de la moitié inférieure, nous devons suivre la même procédure pour l'ensemble de valeurs de la moitié supérieure.

Étape 5: Trouvez la valeur IQR de l'intervalle interquartile. Pour trouver la valeur Deduct Q1 de Q3.

IQR = Q3-Q1

Étape 6: Trouvez la valeur Inner Extreme. Une extrémité qui tombe en dehors du côté inférieur, qui peut également être qualifiée de valeur aberrante mineure. Multipliez la valeur IQR par 1, 5 et déduisez cette valeur de Q1 vous donne l'extrême inférieur intérieur.

Valeur aberrante inférieure = T1 - (1, 5 * IQR)

Étape 7: Trouvez la valeur Outer Extreme. Une fin qui se situe en dehors du côté supérieur qui peut également être qualifié de valeur aberrante majeure. Multipliez la valeur IQR par 1, 5 et additionnez cette valeur avec Q3 vous donne l'extrême supérieur externe.

Valeur aberrante supérieure = Q3 + (1, 5 * IQR)

Étape 8: Les valeurs qui se situent en dehors de ces extrêmes internes et externes sont les valeurs aberrantes pour l'ensemble de données donné.

Pertinence et utilisations de la formule des valeurs aberrantes

Les valeurs aberrantes sont très importantes dans tout problème d'analyse de données. La valeur aberrante montre une incohérence dans n'importe quel ensemble de données car elle est définie comme les valeurs distantes rares dans l'ensemble de données de l'une à l'autre. Ceci est très utile pour trouver les défauts qui se sont produits dans l'ensemble de données. Parce que lorsque vous placez une erreur dans l'ensemble de données, elle affecte la moyenne et la médiane, ce qui peut entraîner des écarts importants dans le résultat si des valeurs aberrantes se trouvent dans l'ensemble de données. Il est donc essentiel de connaître les valeurs aberrantes à partir de l'ensemble de données afin d'éviter de graves problèmes dans l'analyse statistique.

Articles recommandés

Cela a été un guide pour la formule des valeurs aberrantes. Ici, nous discutons de la façon de calculer les valeurs aberrantes avec des exemples pratiques et un modèle Excel téléchargeable. Vous pouvez également consulter les articles suivants pour en savoir plus -

  1. Guide de la formule de milieu de gamme
  2. Exemples de formule salariale
  3. Calculatrice pour la formule DPMO
  4. Comment calculer la distribution T?
  5. Formule de déviation quartile | Exemples