Introduction aux méthodes du noyau dans l'apprentissage automatique

L'algorithme utilisé pour l'analyse de modèle est appelé méthode du noyau dans l'apprentissage automatique. En général, l'analyse est effectuée pour trouver des relations dans les ensembles de données. Ces relations peuvent être le clustering, la classification, les composants principaux, la corrélation, etc. La plupart de ces algorithmes qui résolvent ces tâches d'analyse du modèle, ont besoin des données en représentant brut, pour être explicitement transformées en une représentation vectorielle de caractéristiques. Cette transformation peut être effectuée via une carte d'entités spécifiée par l'utilisateur. Ainsi, on peut considérer que seul le noyau spécifié par l'utilisateur est requis par la méthode du noyau.

La terminologie Kernal Method vient du fait qu'ils utilisent la fonction de noyau, ce qui leur permet d'effectuer l'opération dans un espace de caractéristique implicite de grande dimension sans avoir besoin de calculer les coordonnées des données dans cet espace. Au lieu de cela, ils calculent simplement le produit interne entre les images de toutes les paires de données dans l'espace des fonctionnalités.

Ces types d'opérations sont la plupart du temps moins coûteux en termes de calcul que le calcul explicite des coordonnées. Cette technique est appelée «astuce du noyau». Tout modèle linéaire peut être converti en un modèle non linéaire en appliquant l'astuce du noyau au modèle.

La méthode du noyau disponible dans l'apprentissage automatique est l'analyse des composants principaux (ACP), le regroupement spectral, les machines à vecteurs de support (SVM), l'analyse de corrélation canonique, le perceptron du noyau, les processus gaussiens, la régression des crêtes, les filtres adaptatifs linéaires et bien d'autres. Ayons une compréhension de haut niveau de quelques-unes de ces méthodes du noyau.

Top 7 des méthodes du noyau dans l'apprentissage automatique

Voici la mention des méthodes du noyau dans l'apprentissage automatique ci-dessous:

1. Analyse en composantes principales

L'analyse en composantes principales (ACP) est une technique pour extraire la structure d'ensembles de données éventuellement de grande dimension. Elle est facilement réalisée en utilisant des algorithmes itératifs qui estiment les composants principaux ou en résolvant un problème de valeur propre. PCA est une transformation orthogonale du système de coordonnées dans lequel nous décrivons nos données. Le nouveau système de coordonnées est obtenu par projection sur les axes principaux des données. Un petit nombre de composantes principales est souvent suffisant pour représenter la majeure partie de la structure des données. L'une de ses principales applications consiste à effectuer une analyse exploratoire des données pour créer un modèle prédictif. Il sert principalement à visualiser la relation entre les populations et la distance génétique.

2. Soutenir la machine vectorielle

SVM peut être défini comme un classifieur pour séparer l'hyperplan où l'hyperplan est le sous-espace d'une dimension de moins que l'espace ambiant. La dimension de cet espace mathématique est définie comme le nombre minimum de coordonnées nécessaires pour spécifier n'importe quel point tandis que l'espace ambiant est l'espace qui entoure l'objet mathématique. Désormais, l'objet mathématique peut être compris comme un objet abstrait qui n'existe à aucun moment ni en aucun lieu mais existe comme un type de chose.

3. Processus gaussien

Le processus gaussien a été nommé d'après Cark Friedrich Gauss car il utilise la notation de la distribution gaussienne (distribution normale). Il s'agit d'un processus stochastique qui signifie une collection de variables aléatoires indexées par le temps ou l'espace. Dans le processus gaussien, les variables aléatoires ont une distribution normale multivariée, c'est-à-dire que toutes ses combinaisons linéaires finies sont normalement distribuées. Le processus gaussien utilise les propriétés héritées d'une distribution normale et est donc utile dans la modélisation statistique. L'algorithme d'apprentissage automatique qui implique cette méthode du noyau utilise la mesure de l'apprentissage paresseux et la similitude entre les points pour prédire la valeur des points invisibles à partir des données d'entraînement. Cette prédiction n'est pas seulement l'estimation mais l'incertitude à ce point.

4. Analyse de corrélation canonique

L'analyse de corrélation canonique est un moyen d'inférer des informations à partir de matrices de covariance croisée. Elle est également connue sous le nom d'analyse canonique des variables. Supposons que nous ayons deux vecteurs X, Y de variable aléatoire disons deux vecteurs X = (X1, …, Xn) et vecteur Y = (Y1, …, Ym), et la variable ayant une corrélation, alors CCA calculera une combinaison linéaire de X et Y qui a la corrélation maximale entre eux.

5. Regroupement spectral

Dans l'application de la segmentation d'images, le regroupement spectral est connu sous le nom de catégorisation d'objets basée sur la segmentation. Dans le clustering spectral, la réduction de dimensionnalité est effectuée avant le clustering dans moins de dimension, ceci est fait en utilisant la valeur propre de la matrice de similarité des données. Il a ses racines dans la théorie des graphes, où cette approche est utilisée pour identifier les communautés de nœuds dans un graphique qui est basé sur les arêtes qui les relient. Cette méthode est suffisamment flexible et nous permet également de regrouper des données non graphiques.

6. Filtre adaptatif

Le filtre adaptatif utilise un filtre linéaire qui comprend une fonction de transfert, qui est contrôlée par des paramètres variables et les méthodes, qui seront utilisées pour ajuster ces paramètres selon l'algorithme d'optimisation. La complexité de cet algorithme d'optimisation est la raison pour laquelle tout filtre adaptatif est un filtre numérique. Un filtre adaptatif est nécessaire dans les applications où il n'y a pas d'informations préalables sur l'opération de traitement souhaitée à l'avance ou qui changent.

La fonction de coût est utilisée dans le filtre adaptatif en boucle fermée, car elle est nécessaire pour les performances optimales du filtre. Il détermine comment modifier la fonction de transfert de filtre pour réduire le coût de la prochaine itération. L'une des fonctions les plus courantes est l'erreur quadratique moyenne du signal d'erreur.

7. Perceptron à noyau

Dans l'apprentissage automatique, le perceptron du noyau est un type de l'algorithme d'apprentissage du perceptron populaire qui peut apprendre les machines du noyau, comme les classificateurs non linéaires qui utilisent une fonction du noyau pour calculer la similitude des échantillons qui ne sont pas vus aux échantillons d'apprentissage. Cet algorithme a été inventé en 1964, ce qui en fait le premier apprenant de la classification du noyau.

La plupart des algorithmes du noyau discutés sont basés sur une optimisation convexe ou des problèmes propres et sont statistiquement bien fondés. Leurs propriétés statistiques sont analysées à l'aide de la théorie de l'apprentissage statistique.

Parlant des domaines d'application des méthodes du noyau, il est diversifié et comprend la géostatistique, le krigeage, la pondération de distance inverse, la reconstruction 3D, la bioinformatique, la chimioinformatique, l'extraction d'informations et la reconnaissance de l'écriture manuscrite.

Conclusion

J'ai résumé certaines terminologies et types de méthodes de noyau dans l'apprentissage automatique. En raison du manque d'espace, cet article n'est en aucun cas complet et vise simplement à vous donner une compréhension de la méthode du noyau et un bref résumé de leurs types. Cependant, couvrir cet article vous fera faire le premier pas dans le domaine de l'apprentissage automatique.

Articles recommandés

Ceci est un guide de la méthode du noyau dans l'apprentissage automatique. Nous discutons ici des 7 types de méthodes du noyau dans l'apprentissage automatique. Vous pouvez également consulter l'article suivant.

  1. Noyau monolithique
  2. Clustering dans l'apprentissage automatique
  3. Apprentissage automatique de la science des données
  4. Apprentissage automatique non supervisé
  5. Filtres PHP | Comment valider l'entrée utilisateur à l'aide de divers filtres?
  6. Guide complet du cycle de vie de l'apprentissage automatique

Catégorie: