Introduction à la liste des packages R

Un package en langage de programmation R est une unité qui fournit les fonctionnalités requises qui peuvent être utilisées en le chargeant dans l'environnement R. Une liste de packages R est similaire à une bibliothèque en C, C ++ ou Java. Donc, essentiellement, un package peut avoir de nombreuses fonctionnalités comme des fonctions, des constantes, etc. que nous allons permettre à l'utilisateur de les utiliser dans le contexte d'un problème particulier. Dans R, un package requis peut être chargé à l'aide de la fonction library (). Dans le cas où un package n'est pas présent, il peut être installé à l'aide de la fonction install.packages (). Les packages facilitent les tâches apparemment difficiles grâce à ses fonctionnalités prêtes à l'emploi.

Que sont les packages R?

Il existe de nombreux packages dans R, et la sélection d'un package dépend de son application. Bien qu'il existe certains packages qui sont largement utilisés en raison des fonctionnalités qu'ils fournissent, il n'est pas vrai que d'autres packages soient moins importants. Différents packages ont des objectifs différents; certains sont liés aux techniques statistiques, certains concernent les visualisations, etc.

Dans la section suivante, nous examinerons certains des packages importants dans R:

1. Voiture

Ce package est le compagnon de régression appliquée. Il s'agit d'un gros package qui fournit diverses fonctionnalités pour l'analyse statistique. L'importation de ce package dans l'environnement R importe d'autres packages associés tels que MASS, statistiques, graphiques, etc. qqPlot, tracés résiduels, nuage de points, matrice de nuages ​​de points, etc. Les capacités étendues du package peuvent être évaluées à partir du nombre de fonctions qu'il fournit.

2. Corrplot

Le package fournit un affichage graphique d'une matrice de corrélation et d'un intervalle de confiance. Le package fournit également des algorithmes pour effectuer un réordonnancement de la matrice. De nombreuses options incluent le choix des couleurs requises, des étiquettes de texte, des étiquettes de couleur, la disposition, etc. Les différentes méthodes de visualisation ou méthodes de paramètres dans le package corrplot sont "cercle", "carré", "ellipse", "nombre", "ombre", "couleur" et "tarte". La fonction corrplot incorporant diverses options donne une représentation visuellement attrayante de la corrélation entre différentes variables, qui, sinon, dans des circonstances normales, comme les nombres, sont difficiles à interpréter. Les corrélations positives sont affichées en bleu et les corrélations négatives en rouge. L'intensité de la couleur et la taille du cercle sont proportionnelles aux coefficients de corrélation.

3. DataExplorer

Ce package traite de l'exploration et du traitement automatisés des données. Il fournit un processus d'exploration de données automatisé destiné aux tâches analytiques et à la modélisation prédictive. Ceci est crucial car il permet à l'utilisateur de comprendre les données et d'extraire des informations. Chaque variable de l'analyse est analysée et analysée par le package. En outre, le package fournit des fonctionnalités pour la visualisation de ces variables en utilisant des techniques graphiques typiques. Il fournit également des méthodes courantes de traitement des données pour traiter et formater les données.

4. Gmodels

Le paquet gmodels fournit divers outils en R pour tracer les données. Il contient diverses fonctions telles que glh.test qui est utilisé pour tester, imprimer ou résumer une hypothèse linéaire générale pour un modèle de régression. La fonction fait. les contrastes convertissent les contrastes lisibles par l'homme sous la forme requise par R pour le calcul. La matrice renvoyée par make.contrasts peut être utilisée comme argument de l'argument contrastes des fonctions de modèle. La fonction coefFrame ajuste un modèle à chaque sous-groupe défini par , puis renvoie un bloc de données avec une ligne pour chaque ajustement et une colonne pour chaque paramètre. La fonction estimable calcule et teste les contrastes et d'autres fonctions linéaires estimables des coefficients du modèle pour lm, glm, etc. La fonction fit.contrast calcule et teste les contrastes arbitraires pour les objets de régression.

5. Gplots

Ce package fournit des fonctionnalités de visualisation via des outils de programmation multiples. Les fonctions du package fonctionnent sur le concept de calcul et de traçage. Les capacités graphiques du package sont démontrées par diverses fonctions telles que le tracé de bande, boxplot2, col2hex, ci2d, hist2d, tracé de texte, tracé d'évier, pilote de ballon, plotCI, moyen de tracé, etc. Ces fonctions permettent de travailler avec des paramètres liés à la couleur, texte et autres aspects graphiques complexes de la visualisation. Ils traitent également des éléments complexes impliqués dans la visualisation basée sur les statistiques, par exemple lmplot2, les fonctions residplot qui permettent à l'utilisateur de conduire un diagnostic de régression détaillé à travers des tracés de diagnostic. Si plusieurs données doivent être tracées dans la même région, mais avec des axes séparés, cela est possible en utilisant la fonction de sur-tracé dans le package.

6. Ggplot2

C'est l'un des packages très connus de R qui offre des capacités visuelles étendues et présente même les résultats de techniques statistiques et mathématiques complexes. Les nombreuses fonctionnalités fournies par le package permettent à l'analyste de tirer des informations des données de la manière la plus interactive. La description R de la fonction est «un système de création déclarative de graphiques basé sur la grammaire des graphiques». Cette grammaire des graphiques signifie que l'utilisateur doit indiquer à `` ggplot2 '' la façon dont les variables doivent être mappées à l'esthétique, ce qui signifie essentiellement que spécifier les aspects graphiques à utiliser et ggplot2 fonctionnera en conséquence en fonction des détails.

7. Lubrifier

Ce package R facilite le travail avec les dates et les heures. Le package de lubrification permet une manipulation facile des données de date et d'heure. Il analyse un nombre et donne une disposition de données appropriée.En fait, les fonctions d'analyse du package gèrent une grande variété de formats et de séparateurs, ce qui simplifie le processus d'analyse. L'une des caractéristiques notables est que le package fournit des fonctionnalités pour gérer les dates avec différents fuseaux horaires.

8. Hmisc

Nommé Harrell Miscellaneous, le package Hmisc contient de nombreuses fonctions pouvant être utilisées pour l'analyse des données, les graphiques de haut niveau et les opérations utilitaires. Il comprend également des fonctions pour calculer la taille et la puissance de l'échantillon, importer et annoter des jeux de données, imputer des valeurs manquantes, fournir des fonctionnalités de table avancées, regrouper des variables, manipuler la chaîne de caractères, convertir des objets R en code HTML, etc.

9. Treillis

Le package propose un système de visualisation de données de haut niveau inspiré des graphiques Trellis. Il met l'accent sur les données multivariées. Les puissantes capacités de visualisation du package fournissent la solution graphique nécessaire. Certaines des fonctions notables du package sont B_07_cloud qui permet de produire un nuage de points 3D et un diagramme de surface filaire; D_level. couleurs, une fonction pour calculer les fausses couleurs représentant une variable numérique ou catégorielle; B_06_levelplot, une fonction qui génère des tracés de niveau et des tracés de contour; A_01_Lattice, une fonction qui fournit des capacités graphiques Lattice. B_09_tmd est une fonction qui génère le tracé de différence moyenne de Tukey; B_11_oneway, une fonction qui correspond au modèle à sens unique. Le package offre ainsi de nombreuses fonctionnalités pour les visualisations via diverses fonctions.

10. MatrixModels

Ce package permet la modélisation avec des matrices «Matrix» clairsemées et denses. Pour ce faire, il utilise des classes modulaires de prédiction et de réponse. Toutes les fonctions fournies par le package sont également importantes, dont certaines sont lm.fit.sparse qui est une fonction d'ajustement pour les modèles linéaires clairsemés, resolCoef qui résout les coefficients et l'incrément de coefficient, modèle. Une matrice qui construit des matrices de conception ou de modèle éventuellement clairsemées, glm4 qui correspond aux modèles linéaires généralisés.

11. Multcomp

Le package permet de multiples comparaisons de k groupes dans des modèles linéaires généralisés. Une liste de neuf procédures standard à savoir. Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott et Tetrade sont fournis à l'utilisateur et l'utilisateur sélectionne les comparaisons en fonction de l'exigence. En plus de cela, une interface d'entrée gratuite est également fournie pour la matrice de contraste qui permet des comparaisons spéciales. La caractéristique notable est que les comparaisons elles-mêmes ne sont pas limitées à une conception particulière telle que équilibrée ou simple, mais plutôt que les programmes sont conçus de telle manière qu'ils conviennent à plusieurs comparaisons dans le modèle linéaire général qui permet des covariables, des moyennes corrélées, des valeurs manquantes, etc.

12. OpenMx

Ce paquet traite essentiellement de la modélisation étendue des équations structurelles. Il fournit des fonctionnalités pour créer des modèles d'équations structurelles. Ces modèles peuvent être manipulés à l'aide de la programmation. Les modèles peuvent être spécifiés avec des matrices ou des chemins tels que LISREL ou RAM. Certains types de modèles comprennent plusieurs groupes, le facteur de confirmation, la distribution du mélange, le seuil catégoriel, les fonctions d'ajustement différentiel, etc.

13. Plyr

Il s'agit d'un package très important qui fournit des fonctionnalités pour la manipulation des données. Il fournit des outils pour fractionner, appliquer et combiner des données. Il est livré avec un ensemble d'outils qui aident à résoudre un ensemble commun de problèmes. Par exemple, nous pouvons parfois avoir besoin de diviser une grosse tâche en tâches plus petites qui sont gérables, puis nous opérons sur chacune des pièces et enfin, nous remettons toutes les pièces ensemble.

14. Qcc

Le package acquiert de l'importance en raison des diverses fonctionnalités d'analyse de qualité qu'il fournit. Il fournit des graphiques de contrôle de qualité Shewhart pour les données continues, d'attributs et de comptage. Parmi les autres graphiques importants figurent les graphiques Cusum et EWMA et les courbes des caractéristiques de fonctionnement. Il offre également une fonctionnalité d'analyse de la capacité des processus. Le graphique de Pareto et le graphique de cause à effet et les graphiques de contrôle multivariés sont des outils utiles fournis par le package.

15. RandomForest

Comme son nom l'indique, ce package est utilisé pour construire un algorithme de forêt aléatoire. Le package implémente l'algorithme de forêt aléatoire de Breiman, qui est basé sur le code FORTRAN original de Beiman et Cutler. L'algorithme est utilisé pour la classification et la régression. Le package peut également être utilisé en mode non supervisé pour évaluer les proximités entre les points de données.

16. Psych

Il s'agit d'un package destiné à un usage spécial. Le package fournit une procédure pour la recherche psychologique, psychométrique et de la personnalité. Les fonctions sont principalement destinées à l'analyse multivariée utilisant diverses techniques statistiques multivariées.

Conclusion-Liste des packages R

Il existe de nombreux packages dans R, et l'application d'un package dépend des exigences. La communauté List of R Packages s'est développée très rapidement, et chaque jour un package est ajouté. Plusieurs packages peuvent fournir des fonctionnalités similaires, mais la sélection d'un package doit être basée sur son étude approfondie.

Articles recommandés

Ceci est un guide pour une liste de packages R. Nous discutons ici de l'introduction aux packages R et de certains packages importants de R. Vous pouvez également consulter nos autres articles suggérés pour en savoir plus -

  1. Packages Java
  2. Qu'est-ce que JNDI en Java?
  3. JColorChooser
  4. Programmation R vs Python

Catégorie: