Introduction à l'apprentissage supervisé et à l'apprentissage non supervisé

L'apprentissage supervisé et l'apprentissage non supervisé sont des tâches d'apprentissage automatique.
L'apprentissage supervisé est simplement un processus d'apprentissage de l'algorithme à partir de l'ensemble de données de formation. L'apprentissage supervisé est l'endroit où vous avez des variables d'entrée et une variable de sortie et vous utilisez un algorithme pour apprendre la fonction de mappage de l'entrée à la sortie. Le but est d'approximer la fonction de cartographie de sorte que lorsque nous avons de nouvelles données d'entrée, nous pouvons prédire les variables de sortie pour ces données.

L'apprentissage non supervisé consiste à modéliser la structure ou la distribution sous-jacente ou cachée dans les données afin d'en savoir plus sur les données. L'apprentissage non supervisé est l'endroit où vous n'avez que des données d'entrée et aucune variable de sortie correspondante.

Ensemble de données de formation: ensemble d'exemples utilisés pour l'apprentissage, où la valeur cible est connue.

Comparaisons directes entre apprentissage supervisé et apprentissage non supervisé (infographie)

Ci-dessous se trouve le top 7 de la comparaison entre l'apprentissage supervisé et l'apprentissage non supervisé

Différences clés entre l'apprentissage supervisé et l'apprentissage non supervisé

Voici la liste des points, décrivez les principales différences entre l'apprentissage supervisé et l'apprentissage non supervisé

1. Les algorithmes d'apprentissage automatique découvrent des modèles dans les mégadonnées. Ces différents algorithmes peuvent être classés en deux catégories en fonction de la façon dont ils «apprennent» sur les données pour faire des prédictions. Ce sont des apprentissages supervisés et non supervisés.

2. Dans l'apprentissage supervisé, le scientifique sert de guide pour enseigner à l'algorithme les conclusions ou les prédictions qu'il doit formuler. Dans l'apprentissage non supervisé, il n'y a pas de réponse correcte, il n'y a pas d'enseignant, les algorithmes sont laissés à eux-mêmes pour découvrir et présenter la structure cachée intéressante dans les données.

3. Le modèle d'apprentissage supervisé utilisera les données de formation pour apprendre un lien entre l'entrée et les sorties.

4. L'apprentissage non supervisé n'utilise pas de données de sortie. Dans l'apprentissage non supervisé, leurs connaissances antérieures ne seront pas étiquetées, tandis que dans l'apprentissage supervisé, elles auront accès aux étiquettes et auront une connaissance préalable des ensembles de données.

5. Apprentissage supervisé: L'idée est que la formation peut être généralisée et que le modèle peut être utilisé sur de nouvelles données avec une certaine précision.

6. Algorithmes d'apprentissage supervisé: machine vectorielle de soutien, régression linéaire et logistique, réseau de neurones, arbres de classification et forêt aléatoire, etc.

7. Les algorithmes non supervisés peuvent être divisés en différentes catégories: algorithmes de cluster, K-means, clustering hiérarchique, algorithmes de réduction dimensionnelle, détections d'anomalies, etc.

8. Algorithmes de classification et de régression largement utilisés dans l'apprentissage supervisé. Les machines à vecteurs de support (SVM) sont des modèles d'apprentissage automatique supervisé avec des algorithmes d'apprentissage associés, ceux-ci peuvent être utilisés à la fois pour la classification et la régression, mais surtout pour les problèmes de classification.

9.Dans le modèle SVM, nous traçons chaque élément de données comme un point dans un espace à n dimensions, (où n est les entités que nous avons), les valeurs de chaque entité étant la valeur d'une coordonnée particulière. Puis la classification s'effectue en trouvant l'hyperplan qui différencie les deux classes.

10.Le principal objectif des algorithmes de régression est de prédire la valeur discrète ou continue. Dans certains cas, la valeur prédite peut être utilisée pour identifier la relation linéaire entre les attributs. Sur la base du problème, des algorithmes de régression de différence peuvent être utilisés. Certains des algorithmes de régression de base sont la régression linéaire, la régression polynomiale, etc.

11.Le clustering est largement utilisé dans l'apprentissage non supervisé. Le regroupement est la tâche de diviser les points de données en nombre de groupes de telle sorte que les mêmes points de traits seront ensemble sous forme de regroupement. Il existe de nombreux algorithmes de clustering; peu d'entre eux sont des modèles de connectivité, des modèles centroïdes, des modèles de distribution et des modèles de densité.

12.Le clustering hiérarchique relève d'un apprentissage non supervisé. Le clustering hiérarchique, comme son nom l'indique, est un algorithme qui construit la hiérarchie des clusters. Cet algorithme commence par tous les points de données affectés à un cluster qui leur est propre. Ensuite, deux clusters les plus proches sont fusionnés dans le même cluster. Au final, cet algorithme se termine lorsqu'il ne reste qu'un seul cluster.

13.KMeans relève de la méthode de clustering non supervisée. Les données seront partitionnées en k clusters, en fonction de leurs fonctionnalités. Chaque cluster est représenté par son centre de gravité, défini comme le centre des points du cluster. KMeans est simple et rapide mais il ne donne pas le même résultat à chaque exécution.

14.Pour mieux comprendre l'apprentissage supervisé et l'apprentissage non supervisé, prenons des exemples concrets. Apprentissage supervisé: Prenons comme exemple l'une des fonctionnalités de Gmail, qui est un courrier indésirable. Sur la base des informations passées sur les courriers indésirables, filtrer un nouvel e-mail entrant dans le dossier Boîte de réception ou le dossier Courrier indésirable. Dans ce scénario, Gmail est modélisé une fonction de mappage pour séparer le courrier entrant en fonction des connaissances antérieures sur les messages, il s'agit d'un apprentissage supervisé.

15.Apprentissage non supervisé: supposons qu'un ami vous invite à sa fête, où vous rencontrez de nouvelles personnes. Vous allez maintenant les classer en utilisant aucune connaissance préalable (apprentissage non supervisé) et cette classification pourrait être sur n'importe quel trait. Il peut s'agir du groupe d'âge, du sexe, de l'habillage, de la qualification scolaire ou de la manière que vous souhaitez. Étant donné que vous n'avez utilisé aucune connaissance préalable des personnes et que vous ne les avez pas classées, cela relève d'un apprentissage non supervisé.

Tableau comparatif de l'apprentissage supervisé et de l'apprentissage non supervisé

Enseignement superviséApprentissage non supervisé

Méthode

Des variables d'entrée et des variables de sortie seront données.Seules les données d'entrée seront données

Objectif

L'objectif d'apprentissage supervisé est de déterminer si bien la fonction que lorsque de nouveaux ensembles de données d'entrée sont fournis, ils peuvent prédire la sortie.L'objectif d'apprentissage non supervisé est de modéliser les modèles cachés ou la structure sous-jacente dans les données d'entrée données afin d'en apprendre davantage sur les données.

Classe

Problèmes d'apprentissage automatique, exploration de données et réseau neuronal,Apprentissage automatique, exploration de données, problèmes et réseau neuronal

Exemples

  • Classification
  • Régression
  • Régression linéaire
  • Machine de vecteur de support
  • Regroupement
  • Association
  • k-means
  • Association
Qui utiliseScientifiques des donnéesScientifiques des données

Eco-systèmes

Traitement de données volumineuses, exploration de données, etc.

Traitement de données volumineuses, exploration de données, etc.

Les usages

L'apprentissage supervisé est souvent utilisé pour les systèmes d'exportation dans la reconnaissance d'images, la reconnaissance vocale, la prévision, l'analyse financière et la formation de réseaux de neurones et d'arbres de décision, etc.

Des algorithmes d'apprentissage non supervisés sont utilisés pour prétraiter les données, lors d'une analyse exploratoire ou pour pré-former des algorithmes d'apprentissage supervisés.

Conclusion - Apprentissage supervisé vs apprentissage non supervisé

Le choix d'utiliser un algorithme d'apprentissage automatique supervisé ou non supervisé dépend généralement de facteurs liés à la structure et au volume de vos données et au cas d'utilisation. En réalité, la plupart du temps, les scientifiques des données utilisent à la fois des approches d'apprentissage supervisé et d'apprentissage non supervisé pour résoudre le cas d'utilisation.

Article recommandé

Il s'agit d'un guide de l'apprentissage supervisé par rapport à l'apprentissage non supervisé, de leur signification, de la comparaison directe, des différences clés, du tableau de comparaison et de la conclusion. Vous pouvez également consulter les articles suivants pour en savoir plus -

  1. 7 meilleures comparaisons entre l'apprentissage supervisé et l'apprentissage par renforcement
  2. 5 Différence la plus utile entre la science des données et l'apprentissage automatique
  3. Apprenez les 10 meilleures différences entre la réduction de carte et le fil
  4. MapReduce vs Apache Spark - 20 comparaisons utiles pour apprendre
  5. Qu'est-ce que l'apprentissage par renforcement?

Catégorie: