Introduction à la régression polynomiale

La régression est définie comme la méthode pour trouver la relation entre les variables indépendantes et dépendantes pour prédire le résultat. Le premier modèle de régression polynomiale a été utilisé en 1815 par Gergonne. Il est utilisé pour trouver la ligne de meilleur ajustement en utilisant la ligne de régression pour prédire les résultats. Il existe de nombreux types de techniques de régression, la régression polynomiale en fait partie. Avant de comprendre cela, il est conseillé d'avoir une bonne connaissance de la régression linéaire, il sera donc facile de marquer les différences entre eux.

Pourquoi la régression polynomiale?

  • Il s'agit de l'une des techniques de régression utilisées par les professionnels pour prédire le résultat. Elle est définie comme la relation entre les variables indépendantes et dépendantes lorsque la variable dépendante est liée à la variable indépendante ayant un nième degré. Il ne nécessite pas que la relation entre les variables dépendantes et indépendantes soit linéaire, donc si la ligne est une courbe, elle peut avoir n'importe quel terme polynomial.
  • La principale différence entre la régression linéaire et polynomiale est que la régression linéaire nécessite une corrélation linéaire entre les variables dépendantes et indépendantes, ce qui pourrait mieux correspondre à la droite si nous incluons un degré plus élevé dans le terme de variable indépendante dans l'équation. L'équation de la régression polynomiale ayant un nième degré peut s'écrire:

Y = b0 + a1x + a2x 2 + a3x 3 +…. anx n

  • Si nous ajoutons des degrés plus élevés tels que quadratique, cela transforme la ligne en une courbe qui correspond mieux aux données. Généralement, il est utilisé lorsque les points de l'ensemble de données sont dispersés et que le modèle linéaire n'est pas en mesure de décrire clairement le résultat. Nous devons toujours garder un œil sur le sur-ajustement et le sous-ajustement tout en considérant ces degrés dans l'équation.
  • Il est préférable de considérer le degré qui passe à travers tous les points de données, mais parfois prendre un degré plus élevé tel que 10 ou 20 peut traverser tous les points de données et réduire l'erreur, mais il capture également le bruit des données qui suradapte le modèle et il peut être évité en ajoutant plus d'échantillons à l'ensemble de données d'apprentissage. Il est donc toujours conseillé de choisir un degré optimal pour s'adapter au modèle.

Il existe deux techniques qui sont utilisées pour décider du degré de l'équation:

  • Sélection avant: c'est la méthode pour augmenter le degré jusqu'à ce qu'il soit suffisamment significatif pour définir le modèle.
  • Sélection en arrière: C'est la méthode de diminution du degré jusqu'à ce qu'il soit suffisamment significatif pour définir le modèle.

Procédure d'application de la régression polynomiale

Veuillez trouver les étapes ou la procédure ci-dessous pour appliquer une régression polynomiale à n'importe quel ensemble de données:

Étape 1: importez l'ensemble de données respectif sur n'importe quelle plate-forme (R ou Python) et installez les packages requis pour l'application du modèle.

Étape 2: divisez l'ensemble de données en ensembles d'apprentissage et de test afin que nous puissions appliquer l'algorithme à l'ensemble de données d'apprentissage et le tester à l'aide de l'ensemble de données de test.

Étape 3: Appliquer des méthodes d'analyse exploratoire des données pour étudier l'arrière-plan des données comme la moyenne, la médiane, le mode, le premier quartile, le deuxième quartile, etc.

Étape 4: appliquez l'algorithme de régression linéaire à l'ensemble de données et étudiez le modèle.

Étape 5: Appliquer l'algorithme de régression polynomiale à l'ensemble de données et étudier le modèle pour comparer les résultats RMSE ou R carré entre la régression linéaire et la régression polynomiale.

Étape 6: Visualisez et prédisez les résultats de la régression linéaire et polynomiale et identifiez le modèle qui prédit l'ensemble de données avec de meilleurs résultats.

Utilisations de la régression polynomiale

  • Il est utilisé dans de nombreuses procédures expérimentales pour produire le résultat en utilisant cette équation.
  • Il fournit une excellente relation définie entre les variables indépendantes et dépendantes.
  • Il est utilisé pour étudier les isotopes des sédiments.
  • Il est utilisé pour étudier la montée de différentes maladies au sein d'une population.
  • Il est utilisé pour étudier la génération de toute synthèse.

Caractéristiques de la régression polynomiale

  • Il s'agit d'un type de méthode de régression non linéaire qui nous indique la relation entre la variable indépendante et la variable dépendante lorsque la variable dépendante est liée à la variable indépendante du nième degré.
  • La droite de meilleur ajustement est déterminée par le degré de l'équation de régression polynomiale.
  • Le modèle dérivé de la régression polynomiale est affecté par les valeurs aberrantes, il est donc toujours préférable de traiter les valeurs aberrantes avant d'appliquer l'algorithme à l'ensemble de données.
  • La fonction Polynomialfeature () se transforme en fonction de matrice en fonction du degré de l'équation.
  • La nature de la courbe peut être étudiée ou visualisée en utilisant un simple nuage de points qui vous donnera une meilleure idée de la relation de linéarité entre les variables et décidera en conséquence.

Conclusion

La régression polynomiale est utilisée dans de nombreuses organisations lorsqu'elles identifient une relation non linéaire entre les variables indépendantes et dépendantes. C'est l'une des techniques de régression difficiles par rapport aux autres méthodes de régression, donc avoir une connaissance approfondie de l'approche et de l'algorithme vous aidera à obtenir de meilleurs résultats.

Articles recommandés

Ceci est un guide pour une régression polynomiale. Nous discutons ici des fonctionnalités et des utilisations de la régression polynomiale. Vous pouvez également consulter nos autres articles suggérés pour en savoir plus–

  1. Algorithme SVM
  2. Méthodes du noyau
  3. Fonction Excel DROITEREG
  4. Algorithmes d'apprentissage automatique
  5. Régression linéaire vs régression logistique | Principales différences

Catégorie: