Introduction à Python Regex

Python est le mot à la mode dans l'industrie technologique de nos jours. C'est une langue qui gagne en popularité à un rythme rapide. Il s'agit d'un langage très dynamique et peut être utilisé pour créer des applications Web pour des algorithmes d'apprentissage automatique. Dans cet article, nous allons découvrir comment Regex est utilisé en Python. Une expression régulière est une forme abrégée d'expression régulière et c'est essentiellement une séquence de caractères qui peut être utilisée comme modèle. La bonne chose est que Python a son propre package Regex intégré appelé re.

Syntaxe:

Nous allons comprendre la syntaxe avec un exemple. L'exemple pour cela, nous pouvons rechercher une chaîne pour voir si elle commence par «He» et se termine par «intelligent».

import reword = "He is very smart"
x =re.search("^He.*smart$", word)
print(x)

Si vous regardez la syntaxe, c'est très simple, il vous suffit tout d'abord d'importer le package regex qui est re, puis d'utiliser l'une des fonctions du package importé selon vos besoins. Si nous exécutons l'exemple de code ci-dessus dans Jupyter, nous obtenons le résultat ci-dessous.

Fonctions Regex en Python

Il existe de nombreuses fonctions d'expression régulière qui nous aident à rechercher une chaîne pour une correspondance. Avant cela, nous allons d'abord découvrir les personnages que nous voyons généralement dans une fonction d'expression régulière.

()

Il représente un ensemble de caractères.

.

Il représente n'importe quel caractère sauf une nouvelle ligne.

*

Il représente zéro ou plusieurs occurrences.

+

Il représente une ou plusieurs occurrences.

^

Il représente le caractère de départ

$

Il représente le caractère de fin.

|

Il représente l'un ou l'autre.

()

Il représente la capture et le groupe.

\

Il est généralement utilisé pour échapper aux caractères spéciaux

Regex possède également quelques séquences spéciales qu'il sera utile de connaître par exemple:

\ w

Il montre une correspondance si la chaîne a n'importe quel ensemble de caractères de mot de (0-9), AZ ou az et trait de soulignement.

\ W

Il renvoie une correspondance si la chaîne ne contient aucun caractère de mot.

\ré

Ces retours correspondent lorsqu'il y a des chiffres dans la chaîne.

\RÉ

Il est opposé au précédent car il renvoie la correspondance si aucun chiffre n'est présent dans la chaîne.

\ s

Il est utilisé pour vérifier les caractères d'espace blanc dans une chaîne. Il renvoie la correspondance si des caractères d'espace blanc sont présents.

\ S

Il renvoie match lorsqu'il n'y a pas d'espaces blancs dans la chaîne.

Fonctions utilisées pour les opérations Regex

Voyons différentes fonctions du module re qui peuvent être utilisées pour les opérations regex en python.

1. fonction findall (): Cette fonction est présente dans le module re. Il renvoie une liste de toutes les correspondances présentes dans la chaîne. Il itère de gauche à droite sur la chaîne. Les correspondances sont également renvoyées dans le même ordre de recherche. Nous allons en donner un exemple. Supposons que nous voulons trouver tous les chiffres présents dans une chaîne. Pour cela, nous utiliserons la fonction findall () dans laquelle nous trouverons tous les chiffres présents dans la chaîne. Voyons maintenant le code pour cela:

Code:

import re
word = "Raju is 22 years old and his mobile number last three-digit is 789"
rgex ='\d+'
x =re.findall(rgex, word)
print(x)

Si nous parcourons le code, on nous attribue essentiellement le mot variable avec une chaîne contenant des chiffres, puis en passant le symbole regex approprié pour les chiffres avec le mot variable comme arguments dans la fonction findall ()

Voyons maintenant le résultat.

Comme vous pouvez le voir, nous obtenons une liste de chiffres.

2. fonction search (): La fonction de recherche est utilisée pour rechercher des modèles dans une chaîne et si une correspondance est trouvée, elle renvoie l'objet. Ici, une chose dont nous devons nous souvenir est que s'il y a plus d'une correspondance, elle ne renvoie que la première occurrence. Si aucune correspondance n'est trouvée, elle n'en renvoie aucune. Nous verrons un exemple pour cela supposer si nous voulons trouver la chaîne qui commence par un mot particulier. Nous testerons les cas de correspondance positifs et négatifs. Voyons le code pour la même chose.

Code:

import re
word = "Raju is 22 years old"
rgex ='^Raju'
x =re.search(rgex, word)
print(x)
regex1= '^Mohan'
x1 = re.search(regex1, word)
print(x1)

Ici, la variable «regex» est utilisée dans un scénario positif et la variable «regex1» pour un scénario négatif. Veuillez maintenant voir la sortie.

Dans le premier cas, nous obtenons l'objet match retourné tandis que dans le second cas, nous obtenons «Aucun».

3. Fonction Split (): Cette fonction divise la chaîne après chaque correspondance, ce qui signifie que dès qu'il y a une correspondance dans la chaîne, cette fonction sépare la chaîne de là. Donc, s'il y a trois matchs, il y aura trois divisions. Nous allons voir un exemple. Supposons que nous voulons diviser une chaîne après chaque espace. Nous pouvons donc utiliser cette fonction de division à bon escient dans cette situation.

Code:

import re
word = "Raju is 22 years old"
rgex ='\s'
x =re.split(rgex, word)
print(x)

Ici, les motifs représentent un caractère d'espace blanc. Voyons maintenant la sortie.

Comme vous pouvez le voir dans la sortie, la chaîne est divisée après chaque espace.

4. fonction sub (): cette fonction remplace les correspondances par la chaîne ou le caractère choisi par les utilisateurs. Cela signifie essentiellement que s'il y a une correspondance dans la chaîne, il remplacera le caractère ou la chaîne correspondant par votre chaîne ou votre caractère et retournera la chaîne modifiée. Il faut trois arguments. Par exemple, nous allons simplement remplacer l'espace blanc par «&» dans notre chaîne.

Code:

import re
word = "Raju is 22 years old"
rgex ='\s'
x =re.sub(rgex, '&', word)
print(x)

Examinons maintenant la sortie du code ci-dessus.

Comme vous pouvez le voir, tous les espaces ont été remplacés par «&».

Conclusion

Dans cet article, nous avons discuté du module regex et de ses diverses fonctions intégrées Python. Regex est très important et est largement utilisé dans divers langages de programmation.

Articles recommandés

Ceci est un guide de Python Regex. Ici, nous discutons de l'introduction à Python Regex et de certaines fonctions regex importantes avec un exemple. Vous pouvez également consulter nos autres articles suggérés pour en savoir plus–

  1. Boucle en Python
  2. Nombre inversé en Python
  3. Mots-clés Python
  4. Ensembles Python
  5. Mots-clés PHP
  6. Mots-clés C ++