Introduction aux types d'algorithmes d'apprentissage automatique

Les types d'algorithmes d'apprentissage automatique ou les calculs d'IA sont des programmes (mathématiques et justification) qui se modifient pour mieux fonctionner lorsqu'ils sont présentés à plus d'informations. L '«adaptation» d'une partie de l'IA implique que ces projets changent la façon dont ils traitent les informations après un certain temps, tout comme les gens changent la façon dont ils traitent les informations en apprenant. Ainsi, un apprentissage automatique ou un calcul d'IA est un programme avec une méthode particulière pour changer ses propres paramètres, étant donné les critiques sur ses attentes passées en matière d'exposition sur un ensemble de données.

Tous les types d'algorithmes d'apprentissage automatique

Leurs certaines variétés de comment caractériser les types de types d'algorithmes d'apprentissage automatique, mais ils peuvent généralement être divisés en classes selon leur motivation et les classifications fondamentales sont les suivantes:

  1. Enseignement supervisé
  2. Apprentissage non supervisé
  3. Apprentissage semi-supervisé
  4. Apprentissage par renforcement

Qu'est-ce que l'apprentissage supervisé

L'apprentissage supervisé est, où vous pouvez considérer que l'apprentissage est guidé par un instructeur. Nous avons un ensemble de données qui se passe en tant qu'éducateur et son travail consiste à préparer le modèle ou la machine. Lorsque le modèle est préparé, il peut commencer à se fixer sur une attente ou un choix lorsque de nouvelles informations lui sont données.

Exemple d'apprentissage supervisé:

  1. Vous obtenez beaucoup de photos avec des données sur ce qui s'y trouve et après cela, vous formez un modèle pour percevoir de nouvelles photographies.
  2. Vous avez beaucoup de données sur les prix des maisons en fonction de leur taille et de leur emplacement et vous les alimentez dans le modèle et vous les entraînez, puis vous pouvez prédire le prix d'autres maisons en fonction des données que vous alimentez.
  3. Si vous voulez prédire que votre message est du spam ou non, vous pouvez prédire qu'un nouveau message est du spam ou non.

L'algorithme d'apprentissage supervisé est le suivant:

1) Régression linéaire

la régression linéaire est utile pour découvrir le lien entre deux facteurs persistants. L'une est une variable prédictive ou autonome et l'autre est une variable de réaction ou de paroisse. Il recherche une relation mesurable mais pas une relation déterministe. Le lien entre deux facteurs serait déterministe au cas où une variable pourrait être communiquée avec précision par l'autre. Par exemple, en utilisant la température en degrés Celsius, il est concevable de prévoir avec précision Fahrenheit. La relation factuelle n'est pas précise pour décider d'un lien entre deux facteurs. Par exemple, connexion quelque part dans la gamme de taille et de poids. L'idée centrale est d'obtenir une ligne qui correspond le mieux à l'information. La ligne la mieux adaptée est celle pour laquelle les erreurs de prévision globales (toutes les informations se concentrent) sont aussi limitées que ce à quoi on pourrait s'attendre dans les circonstances. L'erreur est la séparation entre le point et la droite de régression.

2) Arbres de décision

Un arbre de décision est un gadget d'aide à la décision qui utilise un diagramme arborescent ou un modèle de décisions et leurs résultats potentiels, y compris les résultats d'événements fortuits, les coûts des ressources et l'utilité. Explorez l'image pour vous faire une idée de ce à quoi elle ressemble.

3) Classification Naive Bayes

Naive Bayes classe un groupe de classificateurs probabilistes de base dépendant de l'application de la théorie de Bayes avec une forte auto-gouvernance (non sophistiquée) les caractéristiques de Naive Bayes. Cette classification Certains des modèles certifiables sont:

Pour marquer un e-mail comme spam ou non spam

Commandez un reportage sur l'innovation, les problèmes gouvernementaux ou le sport

Vérifier une touche de substance transmettant des émotions positives ou des sentiments négatifs?

Utilisé pour la programmation de reconnaissance faciale.

4) Régression logistique

La régression logistique est une méthode factuelle révolutionnaire pour démontrer un résultat binomial avec au moins un facteur informatif. Il quantifie le lien entre la variable de salle absolue et au moins un facteur libre en évaluant les probabilités en utilisant une capacité logistique, qui est l'appropriation logistique combinée.

Normalement, les régressions seront utilisables dans la vie réelle comme:

Score de crédit

La mesure du taux de réussite du marché ou de l'entreprise

Pour prédire les revenus d'une entreprise ou d'un produit

Y aura-t-il un tremblement de terre un jour?

5) Régression des moindres carrés ordinaires

Les moindres carrés est une stratégie pour effectuer une régression directe. la régression directe consiste à ajuster une ligne à travers de nombreux axes. Il existe différentes procédures possibles pour ce faire, et le système des «moindres carrés ordinaires» fonctionne comme ceci: vous pouvez tracer une ligne, puis pour tous les centres de données, mesurer le détachement vertical entre le point et la ligne, et les incorporer vers le haut; la ligne ajustée serait l'endroit où cet agrégat de cloisons est aussi maigre que cela pourrait être normal à la lumière de la situation actuelle.

Qu'est-ce que l'apprentissage non supervisé?

Le modèle apprend par la perception et découvre les structures de l'information. Lorsque le modèle reçoit un ensemble de données, il découvre par conséquent des exemples et des connexions dans l'ensemble de données en y faisant des paquets. Ce qu'il ne peut pas faire, c'est ajouter des marques à la grappe, de la même manière qu'il ne peut pas affirmer qu'il s'agit d'un rassemblement de pommes ou de mangues, cependant, il isolera chacune des pommes des mangues.

Supposons que nous affichions des images de pommes, de bananes et de mangues au modèle, donc ce qu'il fait, à la lumière de certains exemples et connexions, il crée des grappes et partitionne l'ensemble de données en ces groupes. Actuellement, si une autre information est renforcée au modèle, elle l'ajoute à l'un des bouquets créés.

Exemple d'apprentissage non supervisé

  1. Vous avez beaucoup de photographies de 6 individus mais sans données sur qui est sur lequel et vous devez isoler cet ensemble de données en 6 tas, chacun avec les photographies d'une personne.
  2. Vous avez des particules, une partie d'entre elles sont des médicaments et une partie ne l'est pas mais vous ne réalisez pas laquelle sera laquelle et vous avez besoin du calcul pour trouver les médicaments.

L'algorithme d'apprentissage non supervisé est le suivant

Regroupement

Le regroupement est une idée importante en ce qui concerne l'apprentissage sans aide. Il parvient, pour la plupart, à trouver une structure ou un exemple dans une collecte d'informations non catégorisées. Les calculs de clustering traiteront vos informations et découvriront des clusters (groupes) caractéristiques dans le cas où ils existent dans les informations. Vous pouvez également modifier le nombre de paquets que vos calculs doivent distinguer. Il vous permet de modifier la granularité de ces rassemblements.

Il existe différents types de clustering que vous pouvez utiliser

  1. Sélective (répartition)
  2. Modèle: K-means
  3. Agglomératif
  4. Modèle: clustering hiérarchique
  5. Couvrant
  6. Modèle: Fuzzy C-Means
  7. Probabiliste

Types d'algorithmes de clustering

  1. Classification hiérarchique
  2. Clustering K-means
  3. K-NN (k voisins les plus proches)
  4. Analyse des composants principaux
  5. Décomposition de la valeur solitaire
  6. Analyse indépendante des composants
  7. Classification hiérarchique
Classification hiérarchique

Le clustering hiérarchique est un calcul qui construit un ordre de picage des groupes. Cela commence par chacune des informations qui sont distribuées à leur propre groupe. Ici, deux groupes proches seront dans un groupe similaire. Ce calcul se termine lorsqu'il ne reste qu'un seul groupe.

Clustering K-means

K signifie qu'il s'agit d'un calcul de regroupement itératif qui vous encourage à localiser l'incitation la plus notable pour chaque accent. Dans un premier temps, le nombre idéal de groupes est choisi. Dans cette technique de clustering, vous devez regrouper les informations qui se concentrent sur k rassemblements. Un k plus grand signifie des rassemblements plus petits avec une plus grande granularité de la même manière. Un k inférieur signifie de plus grands rassemblements avec moins de granularité.

Le résultat du calcul est un rassemblement de «noms». Il permet de pointer des informations vers l'un des k rassemblements. Dans le clustering k-means, chaque rassemblement est caractérisé par la création d'un centroïde pour chaque rassemblement. Les centroïdes sont comme le noyau de la grappe, qui attrape les focus les plus proches d'eux et les ajoute au groupe.

La classification K-mean caractérise en outre deux sous-groupes

  1. Regroupement agglomératif
  2. Dendrogramme
Regroupement agglomératif

Ce type de regroupement K-means commence par un nombre fixe de grappes. Il désigne toutes les informations dans un nombre précis de groupes. Cette stratégie de clustering ne nécessite pas le nombre de groupes K comme info. La procédure d'agglomération commence par façonner chaque donnée comme une grappe solitaire.

Cette stratégie utilise une mesure de séparation, réduit le nombre de grappes (une dans chaque accent) en combinant le processus. En conclusion, nous avons un grand groupe qui contient chacun des articles.

Dendrogramme

Dans la technique de clustering Dendrogram, chaque niveau parlera à un groupe imaginable. La hauteur du dendrogramme démontre le degré de similitude entre deux grappes de jonction. Plus ils se rapprochent de la base de la procédure, plus il y a de groupes progressivement comparables, ce qui est la découverte du rassemblement à partir d'un dendrogramme qui n'est pas caractéristique et pour la plupart abstrait.

K-voisins les plus proches

K-le plus proche voisin est le plus simple de tous les classificateurs AI. Elle diffère des autres procédures d'IA, en ce sens qu'elle ne fournit pas de modèle. Il s'agit d'un calcul simple qui stocke chaque cas accessible unique et caractérise les nouveaux exemples en fonction d'une mesure de ressemblance.

Cela fonctionne très bien lorsqu'il y a une séparation entre les modèles. Le taux d'apprentissage est modéré lorsque l'ensemble de préparation est énorme et que la séparation n'est pas anodine.

Analyse des principaux composants

Si vous avez besoin d'un espace de dimension supérieure. Vous devez choisir une raison pour cet espace et seulement les 200 scores les plus significatifs de cette prémisse. Cette base est connue comme un composant principal. Le sous-ensemble que vous sélectionnez est un autre espace de petite taille contrastant avec un espace unique. Il conserve cependant une grande partie de la nature multiforme de l'information comme on pouvait s'y attendre.

Qu'est-ce que l'apprentissage par renforcement?

C'est la capacité d'un spécialiste à collaborer avec la terre et à découvrir quel est le meilleur résultat. Il poursuit l'idée de coup et de technique préliminaire. L'opérateur est rémunéré ou puni d'un point pour une bonne réponse ou d'une réponse hors base, et sur la base des récompenses positives retenues par les trains modèles eux-mêmes. De plus, une fois préparé, il se prépare à prévoir les nouvelles informations qui lui seront présentées.

Exemple d'apprentissage par renforcement

  1. L'affichage des publicités, selon les goûts des internautes, est optimisé pour la longue période
  2. Connaître le budget des annonces utilisé en temps réel
  3. renforcement inverse apprendre à mieux connaître les clients comme les aversions

Qu'est-ce que l'apprentissage semi-supervisé?

Type d'apprentissage semi-supervisé, le calcul est préparé sur un mélange d'informations nommées et non étiquetées. Normalement, ce mélange contiendra une quantité limitée d'informations nommées et beaucoup d'informations non étiquetées. La méthode fondamentale incluse est que premièrement, l'ingénieur logiciel regroupera des informations comparables en utilisant un calcul d'apprentissage sans aide et ensuite utilisera les informations nommées actuelles pour nommer le reste des informations non étiquetées. Les cas d'utilisation ordinaire de ce type de calcul ont une propriété typique parmi eux - L'obtention d'informations non étiquetées est généralement modeste alors que la dénomination desdites informations est extrêmement coûteuse. Naturellement, on peut envisager les trois types de calculs d'apprentissage comme supervisé réalisant où une sous-étude est sous la supervision d'un instructeur à la maison et à l'école, non supervisé réalisant où une sous-étude doit donner un sens à une idée lui-même et semi-supervisé réalisant où une l'éducateur montre quelques idées en classe et donne des demandes de renseignements comme travail scolaire qui dépendent d'idées comparables.

Exemple d'apprentissage semi-supervisé

Il est remarquable que plus d'informations = des modèles de meilleure qualité dans l'apprentissage profond (jusqu'à un point de confinement spécifique clairement, mais le plus souvent nous n'avons pas beaucoup d'informations.) Quoi qu'il en soit, obtenir des informations marquées coûte cher. Dans le cas où vous devez préparer un modèle pour distinguer les animaux ailés, vous pouvez installer de nombreux appareils photo pour prendre par conséquent des photos de volailles. C'est généralement modeste. Il est coûteux de recruter des individus pour marquer ces photos. Considérez la possibilité que vous ayez un nombre énorme de photos d'animaux ailés, mais contractez simplement des individus pour marquer un petit sous-ensemble des photos. Comme il s'est avéré, plutôt que de simplement former les modèles sur le sous-ensemble marqué, vous pouvez pré-entraîner le modèle sur l'ensemble de la formation, avant de le peaufiner avec le sous-ensemble nommé, et vous montrez des signes d'amélioration de l'exécution dans ce sens. C'est un apprentissage semi-supervisé. Il met de côté votre argent.

Conclusion

Il existe de nombreux types d'algorithmes d'apprentissage automatique et, en fonction de conditions différentes, nous devons utiliser l'algorithme le mieux adapté pour obtenir les meilleurs résultats. Il existe de nombreux algorithmes qui trouvent la meilleure précision de chaque type d'algorithme d'apprentissage automatique et qui est le plus précis que nous devons utiliser cet algorithme. Nous pouvons minimiser l'erreur de chaque algorithme en réduisant le bruit dans les données. Enfin, je dirai qu'il n'y a pas un seul algorithme d'apprentissage automatique qui puisse vous donner une précision de 100%, même le cerveau humain ne peut pas le faire, alors trouvez le meilleur algorithme de sap pour vos données.

Articles recommandés

Ceci est un guide des types d'algorithmes d'apprentissage automatique. Ici, nous discutons de ce qu'est l'algorithme d'apprentissage automatique?, Et ses types incluent l'apprentissage supervisé, l'apprentissage non supervisé, l'apprentissage semi-supervisé, l'apprentissage par renforcement. Vous pouvez également consulter les articles suivants pour en savoir plus -

  1. Méthodes d'apprentissage automatique
  2. Bibliothèques d'apprentissage automatique
  3. Modèles d'apprentissage automatique
  4. Cadres d'apprentissage automatique
  5. Apprentissage automatique hyperparamètre
  6. Regroupement hiérarchique | Clustering Agglomératif & Diviseur
  7. Créer un arbre de décision | Comment créer | Les avantages
  8. Cycle de vie de l'apprentissage automatique | Top 8 étapes

Catégorie: