Introduction aux méthodes d'apprentissage automatique

L'article suivant, Méthodes d'apprentissage automatique fournit un aperçu des méthodes les plus couramment utilisées dans l'apprentissage automatique. L'apprentissage automatique est une technique qui permet à un ordinateur «d'apprendre» tout seul. Les algorithmes améliorent de manière adaptative leurs performances à mesure que les données disponibles pour l'apprentissage augmentent. C'est plus les données, plus notre modèle serait précis.

Comment les machines apprennent-elles?

Il existe différentes méthodes pour ce faire. La méthode à suivre dépend entièrement de l'énoncé du problème. Selon l'ensemble de données et notre problème, il existe deux façons différentes d'approfondir. L'un est l'apprentissage supervisé et l'autre est l'apprentissage non supervisé. Le tableau suivant explique la classification supplémentaire des méthodes d'apprentissage automatique. Nous en discuterons un par un.

Jetez un œil au tableau suivant!

Comprenons ce que signifie l'apprentissage supervisé.

Enseignement supervisé

Comme son nom l'indique, imaginez un enseignant ou un superviseur vous aider à apprendre. Il en va de même pour les machines. Nous formons ou enseignons la machine à l'aide de données étiquetées.

Certaines des applications d'apprentissage supervisé les plus cool sont:

  • Analyse des sentiments (Twitter, Facebook, Netflix, YouTube, etc.)
  • Traitement du langage naturel
  • Classification d'image
  • Analyse prédictive
  • La reconnaissance de formes
  • Détection de spam
  • Traitement de la parole / séquence

Maintenant, l'apprentissage supervisé est divisé en classification et régression. Voyons, comprenons cela.

Classification

La classification est le processus de recherche d'un modèle qui aide à séparer les données en différentes classes catégorielles. Dans ce processus, les données sont classées sous différentes étiquettes selon certains paramètres donnés en entrée, puis les étiquettes sont prédites pour les données. Catégorique signifie que la variable de sortie est une catégorie, c'est-à-dire rouge ou noir, spam ou non spam, diabétique ou non diabétique, etc.

Les modèles de classification incluent la machine à vecteur de support (SVM), le voisin K le plus proche (KNN), Naive Bayes, etc.

a) Soutenir le classificateur de machine vectorielle (SVM)

SVM est une méthode d'apprentissage supervisé qui examine les données et les trie dans l'une des deux catégories. J'utilise un hyperplan pour classer les données. Un classificateur discriminant linéaire tente de tracer une ligne droite séparant les deux ensembles de données et de créer ainsi un modèle de classification. Il essaie simplement de trouver une ligne ou une courbe (en deux dimensions) ou une variété (en plusieurs dimensions) qui divise les classes les unes des autres.

Remarque - Pour la classification multiclasse, SVM utilise `` un vs reste '', cela signifie calculer différents SVM pour chaque classe.

b) K-classificateur du plus proche voisin (KNN)

  • Si vous lisez attentivement, le nom lui-même suggère ce que fait l'algorithme. KNN considère que les points de données qui sont plus proches, sont beaucoup plus similaires en termes de caractéristiques et donc plus susceptibles d'appartenir à la même classe que le voisin. Pour tout nouveau point de données, la distance à tous les autres points de données est calculée et la classe est décidée en fonction de K voisins les plus proches. Oui, cela peut sembler boiteux, mais pour une partie de la classification, cela fonctionne comme n'importe quoi.
  • Un point de données est classé par le nombre maximum de votes de ses voisins, puis le point de données est attribué à la classe la plus proche parmi ses k-voisins.
  • Dans KNN, aucun apprentissage du modèle n'est requis et tout le travail se produit au moment où une prédiction est demandée. C'est pourquoi KNN est souvent appelé algorithme d'apprentissage paresseux.

c) Classificateur naïf Bayes

  • Naïve Bayes est un algorithme d'apprentissage automatique qui est fortement recommandé pour les problèmes de classification de texte. Il est basé sur le théorème de probabilité de Bayes. Ces classificateurs sont appelés naïfs car ils supposent que les variables d'entités sont indépendantes les unes des autres. Cela signifie, par exemple, que nous avons une phrase complète à saisir, puis Naïve Bayes suppose que chaque mot d'une phrase est indépendant des autres. Et puis les classer en conséquence. Je sais, cela semble assez naïf, mais c'est un excellent choix pour les problèmes de classification de texte et c'est un choix populaire pour la classification des courriers indésirables.
  • Il fournit différents types d'algorithmes Naive Bayes comme BernoulliNB, GaussianNB, MultinomialNB.
  • Il considère que toutes les fonctionnalités ne sont pas liées, il ne peut donc pas apprendre la relation entre les fonctionnalités. Par exemple, disons, Varun aime manger des hamburgers, il aime aussi manger des frites avec du coke. Mais il n'aime pas manger un hamburger et une combinaison de frites avec du coke ensemble. Ici, Naïve Bayes ne peut pas apprendre la relation entre deux caractéristiques mais n'apprend que l'importance des caractéristiques individuelles.

Passons maintenant à l'autre côté de notre méthode d'apprentissage supervisé, qui est une régression.

Régression

La régression est le processus de recherche d'un modèle qui aide à différencier les données à l'aide de valeurs continues. En cela, la nature des données prédites est ordonnée. Certains des modèles de régression les plus utilisés sont la régression linéaire, la forêt aléatoire (arbres de décision) et les réseaux de neurones.

Régression linéaire

  • L'une des approches les plus simples de l'apprentissage supervisé, qui est utile pour prédire la réponse quantitative.
  • La régression linéaire comprend la recherche de la ligne droite la mieux ajustée à travers les points. La ligne la mieux adaptée est appelée ligne de régression. La ligne la mieux ajustée ne passe pas exactement par tous les points de données, mais essaie plutôt de se rapprocher d'eux.
  • Il s'agit de l'algorithme largement utilisé pour les données continues. Cependant, il se concentre uniquement sur la moyenne de la variable dépendante et se limite à une relation linéaire.
  • La régression linéaire peut être utilisée pour les séries chronologiques, la prévision des tendances. Il peut prédire les ventes futures, sur la base des données précédentes.

Apprentissage non supervisé

  • L'apprentissage non supervisé est basé sur l'approche qui peut être considérée comme l'absence d'un enseignant et donc de mesures d'erreur absolues. Il est utile lorsqu'il est nécessaire d'apprendre le clustering ou le regroupement d'éléments. Les éléments peuvent être regroupés (groupés) selon leur similitude.
  • Dans un apprentissage non supervisé, les données sont non étiquetées, non catégorisées et les algorithmes du système agissent sur les données sans formation préalable. Les algorithmes d'apprentissage non supervisés peuvent effectuer des tâches plus complexes que les algorithmes d'apprentissage supervisé.
  • L'apprentissage non supervisé comprend le clustering qui peut être fait en utilisant K means clustering, hiérarchique, mélange gaussien, modèle de Markov caché.

Les applications d'apprentissage non supervisé sont:

  1. Détection de similitude
  2. Étiquetage automatique
  3. Segmentation d'objets (telle que personne, animal, films)

Regroupement

  • Le clustering est une technique d'apprentissage non supervisée utilisée pour l'analyse de données dans de nombreux domaines. L'algorithme de clustering est pratique lorsque nous voulons obtenir des informations détaillées sur nos données.
  • Un exemple concret de clustering serait les clusters de genre de Netflix, qui sont divisés pour différents clients cibles, notamment les intérêts, la démographie, les modes de vie, etc. les clients.

a) K signifie clustering

  • K signifie que l'algorithme de clustering essaie de diviser les données inconnues données en clusters. Il sélectionne au hasard le «k» clusters centroïde, calcule la distance entre les points de données et les clusters centroïdes, puis attribue finalement le point de données au cluster centroïde dont la distance est minimale de tous les centroïdes de cluster.
  • En k-moyennes, les groupes sont définis par le centroïde le plus proche pour chaque groupe. Ce centroïde fait office de «cerveau» de l'algorithme, il acquiert les points de données les plus proches d'eux puis les ajoute aux clusters.

b) Regroupement hiérarchique

Le clustering hiérarchique est presque similaire à celui du clustering normal, sauf si vous souhaitez créer une hiérarchie de clusters. Cela peut être utile lorsque vous souhaitez décider du nombre de clusters. Par exemple, supposons que vous créez des groupes d'articles différents sur l'épicerie en ligne. Sur la page d'accueil, vous voulez quelques éléments généraux et une fois que vous cliquez sur l'un des éléments, des catégories spécifiques, c'est-à-dire des clusters plus spécifiques, s'ouvrent.

Réduction dimensionnelle

La réduction de dimensionnalité peut être considérée comme la compression d'un fichier. Cela signifie, retirer les informations qui ne sont pas pertinentes. Il réduit la complexité des données et tente de conserver des données significatives. Par exemple, dans la compression d'image, nous réduisons la dimensionnalité de l'espace dans lequel l'image reste telle qu'elle est sans détruire trop de contenu significatif dans l'image.

PCA pour la visualisation des données

L'analyse en composantes principales (ACP) est une méthode de réduction de dimension qui peut être utile pour visualiser vos données. PCA est utilisé pour compresser des données de dimension supérieure en données de dimension inférieure, c'est-à-dire que nous pouvons utiliser PCA pour réduire une donnée à quatre dimensions en trois ou 2 dimensions afin que nous puissions visualiser et mieux comprendre les données.

Articles recommandés

Ceci est un guide des méthodes d'apprentissage automatique. Ici, nous avons discuté d'une introduction, Comment les machines apprennent-elles? classifications de l'apprentissage automatique et un organigramme avec une explication détaillée. Vous pouvez également consulter nos autres articles suggérés pour en savoir plus -

  1. Architecture d'apprentissage automatique
  2. Cadres d'apprentissage automatique
  3. Outils d'apprentissage machine
  4. Techniques d'apprentissage automatique
  5. Apprentissage automatique hyperparamètre
  6. Algorithme de clustering hiérarchique
  7. Regroupement hiérarchique | Clustering Agglomératif & Diviseur

Catégorie: