Introduction à l'algèbre linéaire en apprentissage automatique

L'algèbre linéaire fait partie des mathématiques qui incluent des équations linéaires et leurs représentations à travers des matrices et des espaces vectoriels. Il aide à décrire les fonctions des algorithmes et à les implémenter. Il est utilisé avec des données tabulaires ou des images pour mieux ajuster les algorithmes afin d'en tirer le meilleur résultat. Dans cette rubrique, nous allons découvrir l'algèbre linéaire dans l'apprentissage automatique.

Matrice: Il s'agit d'un tableau de nombres sous forme rectangulaire représenté par des lignes et des colonnes.

Exemple:

Vecteur: un vecteur est une ligne ou une colonne d'une matrice.

Exemple:

Tenseur: Les tenseurs sont un tableau de nombres ou de fonctions qui transmutent avec certaines règles lorsque les coordonnées changent.

Comment fonctionne l'algèbre linéaire dans l'apprentissage automatique?

Comme l'apprentissage automatique est le point de contact pour l'informatique et les statistiques, l'algèbre linéaire aide à mélanger la science, la technologie, la finance et les comptes et le commerce. Numpy est une bibliothèque en Python qui travaille sur des tableaux multidimensionnels pour les calculs scientifiques en Data Science et ML.

L'algèbre linéaire fonctionne de différentes manières, comme en témoignent les exemples ci-dessous:

1. Ensemble de données et fichiers de données

Une donnée est une matrice ou une structure de données en algèbre linéaire. Un ensemble de données contient un ensemble de nombres ou de données sous forme de tableau. Les lignes représentent des observations tandis que les colonnes en représentent les caractéristiques. Chaque rangée est de la même longueur. Ainsi, les données sont vectorisées. Les lignes sont préconfigurées et sont insérées dans le modèle une à la fois pour des calculs plus faciles et authentiques.

2. Images et photographies

Toutes les images ont une structure tabulaire. Chaque cellule des images en noir et blanc comprend la hauteur, la largeur et la valeur d'un pixel. De même, les images en couleur ont des valeurs de 3 pixels en dehors de la hauteur et de la largeur. Il forme une matrice en algèbre linéaire. Toutes sortes de modifications telles que le recadrage, la mise à l'échelle, etc. et les techniques de manipulation sont effectuées à l'aide d'opérations algébriques.

3. Régularisation

La régularisation est une méthode qui minimise la taille des coefficients tout en l'insérant dans les données. L1 et L2 sont des méthodes courantes de mise en œuvre en régularisation qui sont des mesures de l'amplitude des coefficients dans un vecteur.

4. Apprentissage en profondeur

Cette méthode est principalement utilisée dans les réseaux de neurones avec diverses solutions réelles, telles que la traduction automatique, le sous-titrage photo, la reconnaissance vocale et de nombreux autres domaines. Il fonctionne avec des vecteurs, des matrices et même des tenseurs car il nécessite des structures de données linéaires ajoutées et multipliées ensemble.

5. Un encodage à chaud

C'est un encodage populaire pour les variables catégorielles pour des opérations plus faciles en algèbre. Un tableau est construit avec une colonne pour chaque catégorie et une ligne pour chaque exemple. Le chiffre 1 est ajouté pour la valeur catégorielle réussie par 0 dans le reste et ainsi de suite, comme indiqué ci-dessous:

6. Régression linéaire

La régression linéaire, l'une des méthodes statistiques, est utilisée pour prédire les valeurs numériques des problèmes de régression ainsi que pour décrire la relation entre les variables.

Exemple: y = A. b où A est un ensemble de données ou une matrice, b est un coefficient et y est la sortie.

7. Analyse en composantes principales ou ACP

L'analyse des composants principaux est applicable lorsque vous travaillez avec des données de grande dimension pour la visualisation et les opérations de modèle. Lorsque nous trouvons des données non pertinentes, nous avons alors tendance à supprimer les colonnes redondantes. L'ACP agit donc comme une solution. La factorisation matricielle est l'objectif principal de l'ACP.

8. Décomposition à valeur unique ou SVD

Il s'agit également d'une méthode de factorisation matricielle généralement utilisée en visualisation, réduction de bruit, etc.

9. Analyse sémantique latente

Dans ce processus, les documents sont représentés sous forme de grandes matrices. Le document traité dans ces matrices est facile à comparer, à interroger et à utiliser. Une matrice est construite où les lignes représentent des mots et les colonnes représentent des documents. SVD est utilisé pour réduire le nombre de colonnes tout en préservant la similitude.

10. Systèmes de recommandation

Les modèles prédictifs reposent sur la recommandation de produits. Avec l'aide de l'algèbre linéaire, la fonction SVD purifie les données à l'aide de produits de distance ou de points euclidiens. Par exemple, lorsque nous achetons un livre sur Amazon, les recommandations sont basées sur notre historique d'achat, en laissant de côté les autres éléments non pertinents.

Avantages de l'algèbre linéaire dans l'apprentissage automatique

  • Agit comme une base solide pour l'apprentissage automatique avec l'inclusion des mathématiques et des statistiques.
    Les tableaux et les images peuvent être utilisés dans des structures de données linéaires.
  • Il est également distributif, associatif et communicatif.
  • Il s'agit d'une approche simple, constructive et polyvalente en ML.
  • L'algèbre linéaire est applicable dans de nombreux domaines tels que les prédictions, l'analyse de signal, la reconnaissance faciale, etc.

Fonctions d'algèbre linéaire dans l'apprentissage automatique

Certaines fonctions d'algèbre linéaire sont vitales dans les opérations de ML et de science des données, comme décrit ci-dessous:

1. Fonction linéaire

L'algorithme de régression linéaire utilise une fonction linéaire où la sortie est continue et a une pente constante. Les fonctions linéaires ont une ligne droite dans le graphique.

F (x) = mx + b

Où, F (x) est la valeur de la fonction,

m est la pente de la ligne,

b est la valeur de la fonction lorsque x = 0,

x est la valeur de la coordonnée x.

Exemple: y = 5x + 25

Soit x = 0, puis y = 5 * 1 + 25 = 25

Soit x = 2, puis y = 5 * 2 + 25 = 40

2. Fonction d'identité

La fonction d'identité relève de l'algorithme non supervisé et est principalement utilisée dans les réseaux neuronaux en ML où la sortie du réseau neuronal multicouche est égale à son entrée, comme indiqué ci-dessous:

Pour chaque x, f (x) correspond à x, c'est-à-dire que x correspond à lui-même.

Exemple: x + 0 = x

x / 1 = x

1 --–> 1

2 --–> 2

3 --–> 3

3. Composition

ML utilise des fonctions de composition et de pipelining d'ordre supérieur dans ses algorithmes pour les calculs et les visualisations mathématiques. La fonction de composition est décrite comme ci-dessous:

(gof) (x) = g (f (x))

Exemple: soit g (y) = y

f (x) = x + 1

gof (x + 1) = x + 1

4. Fonction inverse

L'inverse est une fonction qui s'inverse. Fonctions f et g inverses si le brouillard et le gof sont définis et sont des fonctions d'identité

Exemple:

5. Fonction inversible

Une fonction qui a l'inverse est inversible.

Un par un

sur

Conclusion

L'algèbre linéaire est un sous-domaine des mathématiques. Cependant, il a une utilisation plus large dans l'apprentissage automatique de la notation à la mise en œuvre d'algorithmes dans les jeux de données et les images. Avec l'aide de ML, l'algèbre a eu un impact plus important dans les applications réelles telles que l'analyse des moteurs de recherche, la reconnaissance faciale, les prédictions, l'infographie, etc.

Articles recommandés

Ceci est un guide sur l'algèbre linéaire dans l'apprentissage automatique. Nous discutons ici comment l'algèbre linéaire a fonctionné dans l'apprentissage automatique avec les avantages et quelques exemples. Vous pouvez également consulter l'article suivant.

  1. Apprentissage automatique hyperparamètre
  2. Clustering dans l'apprentissage automatique
  3. Apprentissage automatique de la science des données
  4. Apprentissage automatique non supervisé
  5. Différence entre régression linéaire et régression logistique

Catégorie: