Introduction aux étiquettes Boxplot dans R

Les étiquettes boxplot aident à visualiser les données distribuées dans R. Le graphique représente la moyenne, la médiane et la variance. Les valeurs sont données en entrée de la fonction boxplot (). La fonction Boxplot () crée le boxplot à l'aide de données d'entrée données. Boxplot peut être créé pour des variables individuelles ou un groupe.

Tracer le graphique en boîte à moustaches

  • Nous avons besoin de cinq entrées valorisées comme la moyenne, la variance, la médiane, le premier et le troisième quartile.
  • Identifier s'il y a des valeurs aberrantes dans les données.
  • Concevez le modèle pour tracer les données.

Paramètres sous la fonction boxplot ()

  1. formule: Ce paramètre permet de répandre des valeurs numériques dans plusieurs groupes.
  2. Data :: Input data qui contient soit un bloc de données soit une liste.
  3. Sous-ensemble: paramètre vectoriel facultatif pour spécifier un sous-ensemble pour le traçage.
  4. xlab: annotation sur l'axe des x
  5. ylab: annotation de l'axe y.
  6. range: range spécifie les extensions de tracé.
  7. action: spécifiez ce qui se passe quand il y a une valeur nulle. Ignorez la réponse ou la valeur.

Création de données aléatoires

Nous pouvons créer des données d'échantillonnage aléatoires grâce à la fonction rnorm ().

Utilisons maintenant rnorm () pour créer des données d'échantillonnage aléatoires de 10 valeurs.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2))

La commande ci-dessus génère 10 valeurs aléatoires avec une moyenne de 3 et un écart type = 2 et les stocke dans la trame de données.

Lorsque nous imprimons les données, nous obtenons la sortie ci-dessous.

Stat1

1 2, 662022

2 2.184315

3 5, 974787

4 4.536203

5 4.808296

6 3.817232

7 1.135339

8 1.583991

9 3.308994

10 4.649170

Nous pouvons convertir la même entrée (données) en fonction boxplot qui génère le tracé.

Nous ajoutons plus de valeurs aux données et voyons comment le tracé change.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data)

Ajouter plus de valeurs aléatoires et l'utiliser pour représenter un graphique.

Les valeurs ci-dessous sont stockées dans la variable de données.

STAT 1STAT 2STAT 3STAT 4
3.7954654.218645.8275852.157315
0, 9117264.091196.2608112.26594
3, 7078283.359875.889453.714557
0.1157724.51235.9348582, 40645
0, 6975562.159456.811472, 571304
5.1292313.26986.2500683.025175
5.4041014.389395.6700612, 9901
1, 4550663.130595.6923232, 69693
0, 8686365.423115.4154352, 674768
2.141133.907286.2060592, 806656

Vous trouverez ci-dessous le graphique en boîte à moustaches avec 40 valeurs. Nous avons 1-7 nombres sur l'axe des y et stat1 à stat4 sur l'axe des x.

Nous pouvons modifier l'alignement du texte sur l'axe des x en utilisant un autre paramètre appelé las = 2.

Analyse du graphique des étiquettes R Boxplot

Nous avons donné l'entrée dans le bloc de données et nous voyons le graphique ci-dessus.

Pour comprendre les données, regardons les valeurs stat1.

Le graphique représente les 5 valeurs. En commençant par la valeur minimale du bas, puis le troisième quartile, la moyenne, le premier quartile et la valeur minimale.

Le tracé ci-dessus présente un alignement du texte horizontal sur l'axe des x.

Changer la couleur

Dans tous les exemples ci-dessus, nous avons vu l'intrigue en noir et blanc. Voyons comment changer la couleur de l'intrigue.

Nous pouvons ajouter le paramètre col = color dans la fonction boxplot ().

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col="red")
data

Ci-dessous, nous pouvons voir la sortie du tracé en rouge.

En utilisant le même code ci-dessus, nous pouvons ajouter plusieurs couleurs à l'intrigue.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, col=c("red", "blue", "green", "yellow")
data

Ajout d'étiquettes

Nous pouvons ajouter des étiquettes en utilisant les paramètres xlab, ylab dans la fonction boxplot ().

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", col=c("red", "blue", "green", "yellow"))
data

En utilisant le paramètre principal, nous pouvons ajouter un en-tête au tracé.

data<-data.frame(Stat1=rnorm(10, mean=3, sd=2),
Stat2=rnorm(10, mean=4, sd=1),
Stat3=rnorm(10, mean=6, sd=0.5),
Stat4=rnorm(10, mean=3, sd=0.5))
boxplot(data, las=2, xlab="statistics", ylab="random numbers", main="Random relation", notch=TRUE, col=c("red", "blue", "green", "yellow"))
data

Le paramètre Notch est utilisé pour rendre le tracé plus compréhensible. Comme les médianes de stat1 à stat4 ne correspondent pas dans le graphique ci-dessus.

Avantages et inconvénients de la boîte à moustaches

Les avantages

  • Il est facile de résumer de grandes quantités de données avec des étiquettes de boîte à moustaches.
  • Affiche la plage et la distribution des données sur l'axe.
  • Il indique la symétrie et l'asymétrie
  • Aide à identifier les valeurs aberrantes dans les données.

Désavantages

  • Peut être utilisé uniquement pour les données numériques.
  • S'il y a des écarts dans les données, le diagramme en boîte ne peut pas être précis.

Remarques:

  1. Les graphiques doivent être étiquetés correctement.
  2. Les échelles sont importantes; changer d'échelle peut donner aux données une vue différente.
  3. La comparaison des données avec des échelles correctes doit être cohérente

Conclusion - R Boxplot labels

Le regroupement des données est facilité à l'aide de boîtes à moustaches. Le diagramme en boîte prend en charge plusieurs variables ainsi que diverses optimisations. Nous pouvons également faire varier les échelles en fonction des données.

Les boîtes à moustaches peuvent être utilisées pour comparer diverses variables ou ensembles de données.

L'utilisabilité de boxplot est facile et pratique. Nous avons besoin de données cohérentes et d'étiquettes appropriées. Les boîtes à moustaches sont souvent utilisées en science des données et même par les équipes commerciales pour regrouper et comparer les données. Boxplot donne un aperçu du potentiel des données et des optimisations qui peuvent être faites pour augmenter les ventes.

Boxplot est un moyen intéressant de tester les données qui donne un aperçu de l'impact et du potentiel des données.

Articles recommandés

Ceci est un guide pour les étiquettes R Boxplot. Ici, nous discutons des paramètres sous la fonction boxplot (), comment créer des données aléatoires, changer la couleur et l'analyse du graphique ainsi que les avantages et les inconvénients. Vous pouvez également consulter l'article suivant pour en savoir plus -

  1. Types de visualisation des données
  2. Mise en œuvre de l'entrepôt de données
  3. Techniques de science des données
  4. Qu'est-ce que le Data Cube?

Catégorie: