Introduction à l'histogramme en R

Dans cet article, nous commencerons par l'histogramme de base dans l'implémentation et les personnalisations de R. L'histogramme joue un rôle important dans les analyses de données pour visualiser les données. La programmation R est un environnement spécial pour le calcul statistique et les principes fondamentaux de la science des données. Dans la programmation R, les jeux de données et les fonctions sont regroupés sous forme de packages. La plupart des programmes d'analyse visuelle utilisent des histogrammes et définissent la largeur du bac par défaut. Ils permettent de saisir rapidement les informations sur les données, ce qui est un rôle primordial dans la science des données. Ici, nous allons construire un histogramme en utilisant les commandes R.

Qu'est-ce que l'histogramme?

L'histogramme est une représentation imagée d'une distribution d'ensembles de données avec laquelle nous pourrions facilement analyser quel facteur a une plus grande quantité de données et le moins de données. En d'autres termes, l'histogramme permet de faire des tracés de fréquence cumulés sur l'axe x et l'axe y. En fait, les histogrammes prennent des données groupées et non groupées. Pour un histogramme de données groupées sont construites en tenant compte des limites de classe, tandis que les données non groupées, il est nécessaire de former la distribution de fréquence groupée. Ils aident à analyser efficacement la portée et l'emplacement des données. Une structure commune d'histogrammes est appliquée comme une falaise normale et asymétrique pendant la distribution des données.

Contrairement à une barre, l'histogramme du graphique n'a pas d'espace entre les barres et les barres sont nommées ici comme des bacs avec lesquels les données sont représentées à intervalles égaux. Histogramme Prend une variable continue et se divise en intervalles, il est nécessaire de choisir la bonne largeur de bac. La principale différence entre le graphique à barres et l'histogramme est que le premier utilise des ensembles de données nominaux pour tracer tandis que l'histogramme trace les ensembles de données continus. R utilise la fonction hist () pour créer des histogrammes. Cette fonction hist () utilise un vecteur de valeurs pour tracer l'histogramme. L'histogramme comprend une plage de valeurs continues sur l'axe des x, l'axe des y trace les valeurs fréquentes des données dans l'axe des x avec des barres de variations de hauteurs.

Syntaxe:

La syntaxe de création de l'histogramme est

hist (v, main, xlab, xlim, ylim, breaks, col, border)
where v – vector with numeric values
main – denotes title of the chart
col – sets color
border -sets border color to the bar
xlab - description of x-axis
xlim - denotes to specify range of values on x-axis
ylim – specifies range values on y-axis
break – specifies the width of each bar.

Création d'un histogramme dans R

Pour l'analyse, l'histogramme de l'objectif nécessite un ensemble de données intégré à importer dans R. R et ses bibliothèques ont une variété de packages et de fonctions graphiques. Ici, nous utilisons l'ensemble de données suisse et des passagers aériens. Pour calculer un histogramme pour une valeur de données donnée, la fonction hist () est utilisée avec un signe $ pour sélectionner la certaine colonne d'une donnée de l'ensemble de données pour créer un histogramme.

L'exemple suivant calcule un histogramme de la valeur des données dans la colonne Examen de l'ensemble de données nommé Swiss.

Exemple 1: Créons un histogramme simple

Code:

hist (swiss $Examination)

Production:

Hist est créé pour un ensemble de données suisse avec un examen de colonne. cela trace simplement un bac avec fréquence et axe x.

Exemple 2: histogramme avec plus d'arguments

Pour parvenir à une meilleure compréhension des histogrammes, nous devons ajouter plus d'arguments à la fonction hist pour optimiser la visualisation du graphique. Modification des étiquettes x et y en une plage de valeurs Les arguments xlim et ylim sont ajoutés à la fonction.

Exemple:

hist (Air Passengers, xlim=c (150, 600), ylim=c (0, 35))
In the above example x limit varies from 150 to 600 and Y – 0 to 35.
// Adding breaks
hist (AirPassengers,
main="Histogram with more Arg",
xlab="Name List",
border="Green",
col="Orange",
xlim=c (100, 600),
ylim=c(0, 40),
breaks=5)

Production:

Le code ci-dessus trace un histogramme pour les valeurs de l'ensemble de données Air Passengers, donne le titre comme «Histogramme pour plus d'arg», l'étiquette de l'axe des x comme «Liste de noms», avec une bordure verte et une couleur jaune aux barres, en limitant la valeur de 100 à 600, les valeurs imprimées sur l'axe des y par 2 et rendant la largeur du bac à 5.

Ajout de deux couleurs différentes à la barre

hist (swiss$Examination, col=c ("violet”, "Chocolate2"), xlab="Examination”, las =1, main=" color histogram")

Production:

Ajouter plus de barres à l'histogramme

hist (swiss$Education, breaks=40, col="violet", xlab="Education", main=" Extra bar histogram")

Production:

Exemple 3: Histogramme dans R Its renvoie une valeur

Air <- AirPassengers
hist (Air)
h <- hist (Air)
h
$breaks

Production:

Exemple 4: utilisation de l'argument Break pour modifier la largeur de la corbeille

Pour avoir plus de points d'arrêt entre la largeur, il est préférable d'utiliser la valeur dans la fonction c ().

hist (AirPassengers, breaks=c (100, seq (200, 700, 150)))

Production:

Le graphique ci-dessus prend la largeur de la barre à travers les valeurs de séquence.

Exemple 5: implémentation de la courbe de distribution normale dans l'histogramme

Nous utiliserons l'ensemble de données «swiss» pour les valeurs de données pour tracer un graphique. Ici, la courbe de fonction () est utilisée pour afficher la ligne de distribution.

Code:

curve (dnorm(x, mean=mean(swiss$Education), sd=sd(swiss$Education)), add=TRUE, col="red")

Production:

Exemple 6: Tracer la distribution de probabilité

hist (AirPassengers,
main="Histogram ",
xlab="Passengers",
border="Yellow",
col="pink",
xlim=c(100, 600),
las=2,
breaks=6,
prob = TRUE)

Création de diagrammes de densité dans l'histogramme en R

La distribution d'une variable est créée à l'aide de la densité de fonction (). Voici l'exemple avec le jeu de données mtcars. Les graphiques de densité aident à la distribution de la forme.

density () // this function returns the density of the data
library(ggplot2)
d <- density (mtcars $qsec)
plot (d, main=" Density of Miles Per second")
polygon (d, col="orange",>

Production:

Using Line () function
hist (swiss$Examination, freq = FALSE, col=c ("violet”, "Chocolate2"),
xlab="Examination”, las =1, main=" Line Histogram")
lines(density(swiss$Examination), lwd = 4, col = "red")

L'histogramme suivant dans R affiche la hauteur sous forme d'examen sur l'axe des x et la densité est tracée sur l'axe des y.

Production:

Conclusion

C'est tout à propos de l'histogramme et précisément l'histogramme est le moyen le plus simple de comprendre les données. Comme nous l'avons vu avec un histogramme, nous pourrions dessiner des graphiques simples et multiples, en utilisant la largeur de la corbeille, la correction de l'axe, le changement des couleurs, etc. L'histogramme permet de visualiser les différentes formes des données. Enfin, nous avons vu comment l'histogramme permet d'analyser les ensembles de données et les points médians sont utilisés comme étiquettes de la classe. L'histogramme aide à changer les intervalles pour produire une description améliorée des données et fonctionne, en particulier avec les données numériques. les histogrammes sont plus préférés dans l'analyse en raison de leur avantage d'afficher un grand ensemble de données. Sur la base de la sortie, nous pourrions visuellement fausser les données et faire facilement des hypothèses.

Articles recommandés

Ceci a été un guide sur l'histogramme dans R. Ici, nous avons discuté du concept, de la syntaxe et de la façon de créer un histogramme dans R avec des exemples. Vous pouvez également consulter les articles suivants pour en savoir plus -

  1. Exemples d'histogramme
  2. Carrière en programmation R
  3. Diagramme de Gantt dans Tableau
  4. Carrière en programmation informatique
  5. Comment créer un graphique linéaire dans R?

Catégorie: