Introduction aux fonctions de chaîne R

Le langage R ou les fonctions de chaîne R sont principalement impliqués pour la représentation graphique des données, l'analyse statistique des données et le reporting. c'est un langage open source. la convention d'appellation de cette langue a été dérivée des premières lettres des fondateurs de cette langue, ils sont Ross Ihaka et Robert Gentleman. Il s'agit d'un langage de programmation interprété. Il a la capacité de s'intégrer à diverses autres procédures de langage, à savoir C ++, Python, etc. Actuellement, R est le langage de programmation le plus utilisé au monde.

Caractéristiques des fonctions de chaîne R

Les principales caractéristiques du langage R sont les suivantes,

  • Un langage statistique finement développé et très simple.
  • Le stockage et la gestion des données sont très efficacement intégrés dans R.
  • Il offre un large éventail d'outils classifiés qui aident à l'analyse des données
  • R propose également des bibliothèques pour obtenir des représentations graphiques des données

Manipulation des fonctions de chaîne R

Ci-dessous est donnée la liste des fonctions de manipulation des chaînes R.

1. Grep () dans les fonctions de chaîne R

Utilisé pour faire correspondre un modèle dans les données et remplacer le modèle par une chaîne différente. La fonction grep peut être exprimée de plusieurs façons dans les langages R sont regexpr, gregexpr grep, grepl et regexec.

Ex: grep (modèle, x, ignorer. Case = FALSE, perl = FALSE, value = FALSE, fixed = FALSE, utiliser Bytes = FALSE, inverser = FALSE)

Arguments:

  • Pattern - Chaîne de caractères contenant une expression habituelle censée être égale au vecteur de caractères donné.
  • X, texte - Un objet qui peut être limité en tant que caractère à un vecteur de caractères.
  • Ignorer. Case - (False - Pattern matching works insensitive case, True - Pattern matching works sensitive sensitive)
  • Perl - Pour déterminer les expressions compatibles Perl, en particulier les expressions rationnelles doivent être utilisées.
  • Valeur - Si une correspondance trouvée renvoie vrai sinon faux,
  • Utiliser les octets - Si VRAI après cela, la correspondance se fera octet par octet au lieu de caractère par caractère.
  • Invert - Renvoie les indices si True,
  • Remplacement - La chaîne de remplacement,

2. Nchar ()

Utilisé pour compter le nombre de caractères dans un vecteur. Prend un vecteur au format chaîne comme argument et renvoie un autre vecteur numérique qui contient le nombre de la chaîne.

Ex: nchar (x, type = "chars", allowNA = FALSE, keepNA = NA)

Arguments:

  • X - Chaîne vectorielle.
  • Type - Type, de la chaîne de caractères, utilisé les trois courants mentionnés sont ("octets", "caractères", "largeur").
  • AllowNA - Représente si le «Non applicable» peut être renvoyé en sortie.
  • KeepNA - Si «Sans objet» doit être retourné lorsque X n'est pas trouvé.

3.Substr ()

Utilisé pour sélectionner la valeur de sous-chaîne du vecteur de caractères.

Ex: substr (x, start, stop)

Arguments:

  • X, texte - La chaîne d'affrètement de vecteur.
  • Démarrer, premier - entier. Début de l'élément qui devrait être remplacé
  • Stop, Last - entier. ici le remplacement se fait à la fin de la chaîne

4. strsplit () dans les fonctions de chaîne R

Utilisé pour diviser une chaîne vectorielle existante en plusieurs sous-chaînes en fonction des correspondances de sous-chaînes trouvées en leur sein

Ex: strsplit (x, split, fixed = FALSE, perl = FALSE, useBytes = FALSE)

Arguments:

  • X - Vecteur de caractères qui va être craché.
  • Split - Vecteur de caractères qui sert de séparateur.
  • Corrigé - Effectue une division égale lorsqu'il est passé comme vrai
  • Perl - Faut-il utiliser des expressions rationnelles compatibles Perl?
  • UseBytes - Lorsqu'il est passé comme vrai, il déclenche une correspondance octet par octet au lieu d'une correspondance caractère par caractère

5. Regexpr ()

Plus que grep, le regexpr donne l'index où une correspondance valide commence et la longueur de chaîne correspondante lorsqu'aucune correspondance n'est trouvée -1 valeur est renvoyée.

Ex: regexpr (modèle, texte, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE)

Arguments:

  • Pattern - Chaîne de caractères contenant une expression habituelle qui est supposée être égale au vecteur de caractères donné.
  • X - vecteur de caractères
  • Ignore.case - (False - Pattern matching works insensitive case, True - Patter matching works case sensitive)
  • Perl - Pour déterminer les expressions compatibles Perl, en particulier les expressions rationnelles doivent être utilisées
  • Valeur - Si une correspondance trouvée renvoie vrai sinon faux
  • UseBytes - Si TRUE après cela, la correspondance se fera octet par octet au lieu de caractère par caractère.
  • Inverser - Retourne les indices si Vrai

6. Gregexpr () dans les fonctions de chaîne R

Le gregexpr fournit renvoie une liste d'une longueur similaire à un texte dont chaque élément est d'une forme similaire à la valeur de retour pour regexpr, sauf que les positions préliminaires de chaque correspondance (disjointe) sont données.

Syntaxe: gregexpr (modèle, texte, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE, extract = FALSE)

Arguments:

  • Pattern - Chaîne de caractères contenant une expression habituelle censée être égale au vecteur de caractères donné.
  • X - vecteur de caractères
  • Ignore.case - (False - La correspondance des modèles ne respecte pas la casse, True - La correspondance des modèles fonctionne selon la casse)
  • Perl - Pour déterminer les expressions compatibles Perl, en particulier les expressions rationnelles doivent être utilisées
  • Valeur - Si une correspondance trouvée renvoie vrai sinon faux
  • UseBytes - Si TRUE après cela, la correspondance se fera octet par octet au lieu de caractère par caractère.
  • Inverser - Retourne les indices si Vrai
  • Extraire - Lorsqu'une indication logique correspond, un extrait de la sous-chaîne est créé et renvoyé

7. Regexec ()

Le regexec () dans R String Functions est très similaire à regexpr () sauf qu'ici les index entre parenthèses les sous-expressions correspondantes sont retournés

Syntaxe: regexec (modèle, texte, ignore.case = FALSE, perl = FALSE, fixed = FALSE, useBytes = FALSE)

Arguments:

  • Pattern - Chaîne de caractères contenant une expression habituelle qui peut être supposée être égale au vecteur de caractères donné.
  • X - vecteur de caractères
  • Ignore.case - (False - La correspondance des motifs ne respecte pas la casse, True - La correspondance des notes fonctionne selon la casse)
  • Perl - Pour déterminer les expressions compatibles Perl, en particulier les expressions rationnelles doivent être utilisées
  • Valeur - Si une correspondance trouvée renvoie vrai sinon faux
  • UseBytes - Si TRUE après cela, la correspondance se fera octet par octet au lieu de caractère par caractère.
  • Inverser - Retourne les indices si Vrai

Articles recommandés

Cela a été un guide pour les fonctions de chaîne R. Ici, nous avons discuté du concept, des fonctionnalités, de la manipulation des fonctions de chaîne R avec des exemples et des arguments. Vous pouvez également consulter nos autres articles suggérés pour en savoir plus -

  1. Fonctions de chaîne JavaScript
  2. Fonctions de chaîne Oracle
  3. Fonctions de chaîne T-SQL
  4. Fonctions de chaîne VBScript
  5. Fonctions Regex en Python (exemple)