Comment installer NLTK?

L'article suivant Install NLTK fournit un aperçu de l'installation de NLTK. NLTK est un ensemble de bibliothèques pour le traitement du langage naturel. Il s'agit d'une plateforme de construction de programmes Python pour traiter le langage naturel. NLTK est écrit en langage de programmation Python. Il a été développé par Steven Bird et Edward Loper. Il soutient la recherche et l'enseignement en PNL ou dans des domaines étroitement liés, y compris les sciences cognitives, la linguistique empirique, la recherche d'informations, l'intelligence artificielle et l'apprentissage automatique. NLTK fournit une interface facile à utiliser.

NLTK (Natural Language Toolkit)

  • Le traitement du langage naturel (PNL) fait partie de l'intelligence artificielle qui traite le langage parlé par les humains. Ainsi, il aide les humains à interagir avec les ordinateurs même s'ils ne savent pas comment l'utiliser. En utilisant la PNL, les humains ont juste besoin de dicter la commande aux ordinateurs. Avec la puissance de l'apprentissage automatique, le traitement du langage naturel devient populaire et plus facile à mettre en œuvre. C'est fondamentalement la technique pour interagir avec les humains et effectuer des actions sur les commandes vocales.
  • Cela permet aux appareils d'être utilisés même par le novice qui n'a aucune connaissance de la technologie. Mais la mise en œuvre du traitement du langage naturel n'est pas facile, car une langue parlée par les humains n'a pas de structure définie. Il est ambigu et dépend de mots de contexte qui peuvent avoir une signification différente.
  • NLTK a plus de 50 corpus et sources lexicales tels que WordNet, Corpus Report Report, Penn Treebank Corpus, etc. qui n'ont aucune connaissance approfondie de la programmation. Il possède une large gamme de packages, ce qui en fait l'un des puissants outils pour NLP. Tokenization, Lemmatization, Stemming, Parsing, Count count, Punctuation, word count sont quelques-uns de ces packages.

Installer NLTK pour Windows

Vous trouverez ci-dessous les instructions pour installer NLTK dans Windows. Ceux-ci sont basés sur l'hypothèse que Python n'est pas installé sur le système. NLTK nécessite les versions Python 2.7.3.5 et supérieures.

Étape 1: Téléchargez la dernière version de Python pour Windows à partir du lien ci-dessous

https://www.python.org/downloads/

Étape 2: cliquez sur .exe téléchargé pour l'exécuter.

Étape 3: Sélectionnez personnaliser l'installation.

Étape 4: Vérifiez toutes les fonctionnalités en particulier «pip» car cela aide à installer NLTK et cliquez sur Suivant.

Étape 5: Dans l'écran suivant, sélectionnez les options avancées, sélectionnez le chemin et cliquez sur installer.

Étape 6: Une fois l'installation réussie près de la fenêtre.

Étape 7: copiez le chemin du dossier Scripts pour installer NLTK dans le même dossier.

NLTK peut être facilement installé à l'aide d'un installateur «pip». De plus, nous devons également installer «numpy».

Étape 8: pour installer NLTK, ouvrez l'invite de commande et tapez la commande ci-dessous.

Assurez-vous que l'installation est réussie.

Après une installation réussie, il est maintenant temps d'utiliser le NLTK pour le traitement du langage naturel.

Étape 9: Ouvrez Python Shell et tapez la commande ci-dessous.

S'il est importé sans erreur, cela signifie que NLTK est installé correctement.

Installer NLTK pour Mac / Linux

Contrairement à Windows, les systèmes Linux proposent Python installé. Pour installer NLTK sous Linux / Mac, le programme d'installation du package Pip de Python est utilisé. Afin d'installer pip ou de le mettre à jour, tapez les commandes ci-dessous dans l'invite de commande.

Pour installer python sous Linux, utilisez les commandes ci-dessous.

Étape 1: pour mettre à jour l'index du package, utilisez la commande ci-dessous.

Étape 2: Pour installer Python dans le système Linux, utilisez ci-dessous.

Étape3: Tapez la commande ci-dessous pour installer «pip» pour Python 3.

Étape 4: Une fois «Pip» installé, utilisez les commandes suivantes pour installer NLTK.

NLTK Dataset

NLTK dispose de nombreux jeux de données disponibles pour le traitement du langage naturel, par exemple, WordNet, WikiCorpus, Gutenberg, Opinion Lexicon, Tweebank, etc. Ces jeux de données sont appelés corpus. Fondamentalement, l'ensemble de données NLTK contient un ensemble de fichiers ou de documents. Chaque fichier / document contient une collection de mots, de lettres ou de texte dans une seule langue. Ainsi, un corpus est principalement constitué de bibliothèques pour comprendre / apprendre une langue. Il a des règles de grammaire et de structure d'une langue.

Après avoir correctement installé NLTK, vous pouvez l'importer et également télécharger ses corpus avec la commande suivante.

NLTK downloader ouvre une fenêtre pour télécharger les jeux de données. La taille de l'ensemble de données est grande, donc cela prendra du temps. Pour tester si les jeux de données sont installés correctement, essayez d'importer le jeu de données et utilisez-le.

Traitement de NLTK

Il existe 5 processus principaux de traitement du langage naturel. Ce sont les étapes impliquées dans le traitement de tout texte.

  1. Détection EOS : la détection de fin de parole divise le texte en une collection de phrases significatives. Il divise le texte long en parties qui ont une certaine signification.
  2. Tokenisation : cette étape divise les phrases en jetons. Les jetons ne contiennent pas seulement des mots mais comprennent également des espaces, des sauts de phrases.
  3. Balisage POS : POS signifie pat-of-speech. Ici, les informations sont affectées au jeton. Ces informations suggèrent de quel type de discours il s'agit en tant que temps, verbe, adjectif, nom, etc.
  4. Chunking : Chunking signifie collecter du texte sur la base de balises.
  5. Extraction: l' extraction est un processus continu consistant à parcourir des morceaux et à les étiqueter en tant qu'entités nommées comme des personnes, des lieux, des organisations, etc.

Conclusion:

NLTK est utilisé pour la classification de texte, le sous-titrage d'images, la reconnaissance vocale, la réponse aux questions, la modélisation du langage, la synthèse de documents et de nombreuses autres opérations. Il existe de nombreux autres outils pour le traitement du langage naturel. Mais NLTK possède une large gamme de bibliothèques, ce qui en fait l'un des puissants outils de traitement du langage naturel. Il est plus précis que tout autre outil mais en raison d'un grand nombre de bibliothèques, il est un peu lent. Tout dépend donc des besoins de l'utilisateur. Si l'utilisateur veut de la vitesse, il peut également préférer d'autres outils, mais il devra alors faire des compromis avec la précision du contenu. Mais si la précision est une priorité, ils devraient définitivement opter pour NLTK.

Articles recommandés:

Cela a été un guide pour installer NLTK. Nous discutons ici du concept de base et des différentes étapes pour installer NLTK sur Windows et Linux \ Mac. Vous pouvez également consulter les articles suivants pour en savoir plus-

  1. Installer Kubernetes Dashboard
  2. Comment installer JDK
  3. Installer Docker
  4. Comment installer Magento?
  5. Versions de Magento | Caractéristiques des versions de Magento