Introduction aux packages R

Le package est une collection de fonctions et d'ensembles de données. Les packages aident à améliorer les fonctionnalités d'un langage de programmation. Si nous voulons stocker et traiter des bases de données (c'est-à-dire des fonctionnalités de type SQL à l'aide de trames de données), nous pouvons utiliser le package dplyr dans R. Les packages fournissent également de la documentation sur la façon d'utiliser les fonctions et les ensembles de données dans un package donné.

Où trouvons-nous des forfaits?

Les packages sont disponibles sur Internet via différentes sources. Cependant, il existe certains référentiels de confiance à partir desquels nous pouvons télécharger les packages.

Voici les deux référentiels importants disponibles en ligne.

  • CRAN (Comprehensive R Archive Network): Il s'agit de la communauté R officielle avec un réseau de FTP et de serveurs Web qui contient le dernier code et la documentation de R. Avant de publier vos packages en ligne, il passe par une série de tests qui respecte la politique CRAN .
  • GitHub: GitHub est un autre référentiel célèbre mais non spécifique à R. La communauté en ligne peut partager ses packages avec d'autres personnes et il est utilisé pour le contrôle de version est bien. GitHub est un open-source et n'a pas de processus de révision.

Liste des packages R utiles

Il existe plusieurs packages dans R et peuvent être téléchargés depuis CRAN ou GitHub. Vous trouverez ci-dessous les packages pouvant être utilisés à des fins spécifiques.

1. Chargement des données à partir de sources externes

  • Haven: R lit et écrit les données de SAS.
  • DBI: Pour établir la communication entre la base de données relationnelle et R.
  • RSQlite: Il est utilisé pour lire les données des bases de données relationnelles.

2. Manipulation des données

  • Dplyr: Il est utilisé pour la manipulation de données comme le sous-ensemble, fournit des raccourcis pour accéder aux données et génère des requêtes SQL.
  • Tidyr - Il est utilisé pour convertir des données en formats minuscules.
  • stringr - manipule les expressions de chaîne et les chaînes de caractères.
  • lubridate- Pour travailler avec les données et le temps.

3. Visualisation des données

  • Rgl: Pour travailler sur des visualisations 3D.
  • ggvis: créer et construire une grammaire graphique.
  • googlevis: pour utiliser les outils de visualisation google dans R.

4. Forfaits Web

  1. XML: pour lire et écrire des documents XML dans R.
  2. Httpr: fonctionne avec les connexions http.
  3. Jsonlite: Pour lire les tableaux de données json.

Obtention de packages R

Nous pouvons vérifier les packages disponibles qui sont présents dans R en utilisant le code ci-dessous.

  • available.packages (): Il y a environ 5200 packages disponibles sur le réseau CRAN.

CRAN a des vues de tâches qui regroupent les packages sous un sujet particulier.

Installation des packages R

Nous pouvons installer des packages directement via IDE ou via des commandes. Pour installer des packages, nous utilisons la fonction ci-dessous et spécifions le nom du package.

Syntaxe:

install.packages()

Code:

install.packages(“ggplot2”)

Le code ci-dessus installe le package ggplot2 et ses packages dépendants, le cas échéant.

Nous pouvons installer plusieurs packages à la fois en spécifiant les noms des packages sous un vecteur de caractères.

Syntaxe:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Code:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Installation à l'aide de R Studio

L'avantage d'utiliser un studio R est qu'il est GUI (Interface utilisateur graphique). Nous pouvons choisir les packages à installer et la source de celui-ci.

Nous pouvons accéder aux outils -> Installer les packages.

Chargement des packages R

Après avoir installé le package R, nous devons les charger dans R, pour commencer à utiliser les packages installés.

Nous utilisons la fonction ci-dessous pour charger les packages.

Syntaxe:

library(package name)

Remarque: le nom du package n'a pas besoin d'être indiqué entre guillemets.

Code:

library(ggplot2)

Certains packages affichent des messages lorsqu'ils sont chargés. Certains ne le font pas. Nous pouvons voir les détails de la bibliothèque installée à l'aide du code ci-dessous.

Code:

library(ggplot2)
search()

Production:

«Package: lattice» «package: ggplot2» «package: makeslides»

«Package: knitr» «package: slidify» «tools: rstudio»

Création de votre propre package

Avant de créer notre propre package. Nous devons garder la liste de contrôle ci-dessous à l'esprit avant de créer un package.

  • L'organisation du code est l'une des choses les plus importantes lors de l'écriture de code dans le package. Nous perdons la moitié du temps à rechercher l'emplacement du code au lieu d'améliorer le code. Mettez tous les fichiers dans un dossier facilement accessible.
  • La documentation du code vous aide à comprendre l'objectif du code. Lorsque nous ne revoyons pas souvent le code, nous oublions pourquoi nous avons écrit le code d'une certaine manière. Il peut également aider les utilisateurs à mieux comprendre votre code lorsqu'il est partagé avec eux.
  • Le partage des scripts par e-mail est devenu archaïque. Le moyen le plus simple est de télécharger votre code et de le distribuer sur GitHub. Il est possible que vous obteniez des commentaires qui peuvent vous aider à améliorer le code.

Pour créer votre propre package, nous devons installer le package devtools.

Code:

install.packages("devtools")

Pour vous aider avec la documentation, nous pouvons utiliser le package ci-dessous.

Code:

install.packages("roxygen2")

Après avoir installé le paquet devtools. Vous pouvez créer votre propre package.

Code:

devtools::create ("packagename")

À la place de «nom de paquet», vous pouvez donner le nom que vous souhaitez. Vous pouvez maintenant ajouter vos fonctions sous ce package.

Vous pouvez créer le même nom de fichier que votre nom de fonction.

Syntaxe:

Devtools:create(“firstpackage”)

Paquet de distribution

Vous pouvez distribuer votre package sur github en utilisant le package devtools.

Nous utilisons le code ci-dessous pour distribuer notre package sur github.

Code:

devtools::install_github("yourusername/firstpackage")

Vous pouvez donner votre nom d'utilisateur github et le nom du package que vous avez créé ci-dessus.

Voici les fichiers requis pour un package

  • Les fonctions
  • Documentation
  • Les données

Une fois que nous avons tous les fichiers ci-dessus, nous sommes prêts à les publier dans le référentiel.

Articles recommandés

Ceci est un guide des packages R. Nous discutons ici de la liste des packages R utiles, de l'installation de packages à l'aide de R studio et de la création de votre propre package, etc. Vous pouvez également consulter les articles suivants pour en savoir plus -

  1. Qu'est-ce que le langage de programmation R?
  2. Carrières en programmation R
  3. Programmation R vs Python
  4. MySQL vs SQLite
  5. Liste des packages R

Catégorie: