Formule du coefficient de corrélation (Table des matières)
- Formule
- Exemples
Qu'est-ce que la formule du coefficient de corrélation?
En statistique, certains résultats ont une relation directe avec d'autres situations ou variables et le coefficient de corrélation est la mesure de cette association directe de deux variables ou situations. Ces variables présentent un coefficient de corrélation positif lorsqu'elles se déplacent dans la même direction en même temps. De même, s'ils se déplacent dans des directions différentes et opposées, ils disent avoir un coefficient de corrélation négatif. Par exemple: si le taux d'intérêt du marché baisse, les prêts aux entreprises seront moins chers et l'économie se relancera. Le taux d'intérêt et la croissance de l'économie ont donc un coefficient de corrélation positif. La valeur du coefficient de corrélation définit la force de la relation entre les variables. La valeur maximale du coefficient de corrélation variait de +1 à -1. Si le coefficient de corrélation est +1, alors les variables sont parfaitement corrélées positivement et si cette valeur est -1, alors on l'appelle parfaitement corrélée négativement.
Supposons que nous ayons 2 ensembles de données données par X (X1, X2… Xn) et Y (Y1, Y2… Yn).
La formule du coefficient de corrélation est donnée par:
Correlation Coefficient = Σ ((X – X m ) * (Y – Y m )) / √ (Σ (X – X m ) 2 * Σ (Y – Y m ) 2 )
Où:
- X - Points de données dans l'ensemble de données X
- Y - Points de données dans l'ensemble de données Y
- X m - Moyenne de l'ensemble de données X
- Y m - Moyenne de l'ensemble de données Y
Cette formule semble être très longue et déroutante au début.
Il existe une autre façon de calculer le coefficient de corrélation simplement en utilisant la fonction CORREL () dans Excel. Je vais expliquer les deux formules de coefficient de corrélation en utilisant des exemples.
Exemples de formule de coefficient de corrélation (avec modèle Excel)
Prenons un exemple pour mieux comprendre le calcul du coefficient de corrélation.
Vous pouvez télécharger ce modèle Excel de formule de coefficient de corrélation ici - Modèle Excel de formule de coefficient de corrélationFormule du coefficient de corrélation - Exemple # 1
Disons que nous avons deux ensembles de données X et Y et chacun contient 20 points de données aléatoires. Calculez le coefficient de corrélation pour l'ensemble de données X et Y.
Solution:
La moyenne est calculée comme suit:
- Moyenne de l'ensemble de données X = 15, 6
- Moyenne de l'ensemble de données Y = 13, 8
Maintenant, nous devons calculer la différence entre les points de données et la valeur moyenne.
De même, calculez pour toutes les valeurs de l'ensemble de données X.
De même, calculez pour toutes les valeurs de l'ensemble de données Y.
Calculez le carré de la différence pour les deux ensembles de données X et Y.
Multipliez la différence de X par Y.
Le coefficient de corrélation est calculé en utilisant la formule donnée ci-dessous
Coefficient de corrélation = Σ ((X - X m ) * (Y - Y m )) / √ (Σ (X - X m ) 2 * Σ (Y - Y m ) 2 )
Coefficient de corrélation = 0, 343264
Cela signifie donc que les deux ensembles de données ont une corrélation positive et sont donnés par 0, 343264 .
Formule du coefficient de corrélation - Exemple # 2
Disons que vous cherchez à investir de l'argent sur le marché boursier et que vous souhaitez investir dans 2 actions et que vous souhaitez choisir ces actions de manière à ce que votre portefeuille soit diversifié. Cela signifie que si l'un vous donne un retour négatif, d'autres vous aideront à obtenir un retour positif et vice versa. Donc, fondamentalement, vous voulez investir dans des actions qui ont une corrélation négative. Vous avez 2 actions et avez des informations sur leurs rendements historiques des 15 dernières années.
Solution:
Le coefficient de corrélation est calculé à l'aide de la formule Excel.
Coefficient de corrélation = -0, 45986
Ici, nous avons utilisé la fonction CORREL () d'Excel pour voir le coefficient de corrélation pour les 2 stocks. Vous voyez que la fonction de corrélation a une valeur négative, ce qui signifie que les deux actions ont une corrélation négative. Votre choix est donc adapté à vos besoins.
Explication
Nous savons et discutons que le coefficient de corrélation est une mesure de l'étendue de la relation entre deux variables, mais le problème ici est qu'il ne peut mesurer que la relation qui est linéaire. Cet outil n'est pas efficace pour capturer des relations non linéaires. En outre, il existe quelques autres propriétés du coefficient de corrélation:
- Un coefficient de corrélation est un outil sans unité. C'est une propriété très utile car elle vous permet de comparer des données qui ont différentes unités. Par exemple, les cours des actions dépendent de divers paramètres comme l'inflation, les taux d'intérêt, etc. Nous pouvons donc utiliser les informations publiques pour déterminer la corrélation entre eux.
- Comme expliqué ci-dessus, sa valeur se situe entre + 1 et -1. Donc +1 est parfaitement corrélé positivement et -1 est parfaitement corrélé négativement.
Pertinence et utilisations de la formule du coefficient de corrélation
Le coefficient de corrélation nous aide à mieux comprendre les ensembles de données et leur relation et a de nombreuses applications en finance et en économie. Les instituts financiers, les banques, les entreprises et même les gouvernements utilisent le coefficient de corrélation afin de suivre les données historiques et d'extraire des informations significatives et de prédire les tendances du marché de manière efficace. Un coefficient de corrélation est un outil très puissant, mais il ne doit pas être utilisé dans un silo et appliqué avec d'autres outils. La raison en est simple, nous ne pouvons pas simplement nous fier aux données et les données nous donnent parfois des informations complètes sans signification. Par exemple: si vous avez collecté des informations et que vous avez appris qu'il existe une corrélation positive entre la pluie et la mort de chiens. Cela signifie que l'année où la pluie était plus abondante, un certain nombre de chiens sont morts. Bien qu'il existe une corrélation qui n'est pas significative du tout. C'est ce qu'on appelle une fausse corrélation. Soyez donc très prudent lorsque vous prenez des décisions uniquement sur la base de données.
Articles recommandés
Cela a été un guide pour la formule du coefficient de corrélation. Ici, nous discutons de la façon de calculer le coefficient de corrélation à l'aide d'une formule ainsi que d'exemples pratiques et d'un modèle Excel téléchargeable. Vous pouvez également consulter les articles suivants pour en savoir plus -
- Guide de la formule du coefficient de détermination
- Formule de calcul du R ajusté au carré
- Comment calculer la covariance en utilisant la formule?
- Exemples de formule de corrélation avec un modèle Excel