MathematicsStatistiquesA-Level
AQAIB

Corrélation (PMCC)

Coefficient de corrélation produit-moment.

Understand the formulaSee the free derivationOpen the full walkthrough

This public page keeps the free explanation visible and leaves premium worked solving, advanced walkthroughs, and saved study tools inside the app.

Core idea

Overview

Le coefficient de corrélation linéaire de Pearson (PMCC) est une mesure statistique servant à quantifier la force et la direction d’une relation linéaire entre deux variables continues. Il standardise la covariance des variables par le produit de leurs écarts types, ce qui donne un indice sans unité compris entre -1 et +1.

When to use: Appliquez cette formule lorsque vous analysez des données quantitatives appariées pour voir si une variation d’une variable correspond à une variation proportionnelle d’une autre. Elle est spécifiquement conçue pour les associations linéaires et suppose que les données proviennent d’une distribution normale bivariée.

Why it matters: Ce coefficient est un pilier de la modélisation prédictive, permettant aux scientifiques d’identifier des motifs dans les données climatiques, aux économistes de couvrir le risque sur les marchés financiers et aux sociologues de trouver des liens entre des facteurs démographiques. Il fournit une base mathématique objective pour conclure si deux phénomènes sont statistiquement liés ou indépendants.

Symbols

Variables

r = Correlation, = Covariance Sum, = Var Sum X, = Var Sum Y

Correlation
Variable
Covariance Sum
Variable
Var Sum X
Variable
Var Sum Y
Variable

Walkthrough

Derivation

Formule : Coefficient de corrélation de Pearson (PMCC)

Le PMCC r de Pearson mesure la force et la direction de l'association linéaire entre deux variables, allant de -1 à 1.

  • La relation est approximativement linéaire.
  • Les valeurs aberrantes peuvent fortement affecter r.
1

Définir les quantités sommaires :

Calculez la somme des écarts croisés et les sommes des carrés pour x et y.

2

Énoncer la formule PMCC :

Divisez la mesure de type covariance par le produit des dispersions pour normaliser le résultat.

Note: r=1 est une corrélation linéaire positive parfaite, r=-1 une parfaite négative, et r=0 aucune corrélation linéaire.

Result

Source: AQA A-Level Mathematics — Statistics (Bivariate Data)

Why it behaves this way

Intuition

Imaginez un nuage de points ; le PMCC quantifie à quel point ces points se regroupent autour d'une ligne droite et si cette ligne s'incline vers le haut (corrélation positive) ou vers le bas (corrélation négative).

Term
Une mesure standardisée de la force et de la direction d'une relation linéaire entre deux variables.
Varie de -1 (corrélation linéaire négative parfaite) à +1 (corrélation linéaire positive parfaite), avec 0 indiquant aucune corrélation linéaire.
Term
Somme des produits des écarts de chaque variable par rapport à sa moyenne.
Indique si les variables ont tendance à augmenter/diminuer ensemble (positive) ou dans des directions opposées (négative).
Term
Somme des écarts quadratiques de la variable x par rapport à sa moyenne.
Représente la variabilité totale ou la dispersion des données de la variable x.
Term
Somme des écarts quadratiques de la variable y par rapport à sa moyenne.
Représente la variabilité totale ou la dispersion des données de la variable y.
Term
Un facteur de normalisation dérivé des variabilités individuelles de x et y.
Met à l'échelle le terme de type covariance (S_xy) de sorte que le coefficient de corrélation 'r' soit toujours compris entre -1 et +1, ce qui en fait une mesure sans dimension.

Signs and relationships

  • S_{xy}: Le signe de S_xy détermine directement le signe de 'r'. Un S_xy positif indique que lorsque une variable augmente, l'autre tend à augmenter (corrélation positive).
  • √(S_{xx)S_{yy}}: Ce terme est toujours positif car S_xx et S_yy sont des sommes de carrés, donc non négatifs. Il agit comme un facteur d'échelle, garantissant que la valeur absolue de 'r' ne dépasse jamais 1, standardisant ainsi la mesure de la relation linéaire.

Free study cues

Insight

Canonical usage

Le coefficient de corrélation de Pearson (PMCC) est une mesure statistique sans dimension, utilisée pour quantifier la force et la direction d'une relation linéaire entre deux variables, et est exprimé sous forme de valeur

Dimension note

Le coefficient de corrélation de Pearson (PMCC) est un rapport de la covariance de deux variables au produit de leurs écarts-types.

One free problem

Practice Problem

Un chercheur étudie le lien entre les heures d’étude et les notes d’examen. Étant donné la somme des produits Sxy = 45, la somme des carrés pour les heures d’étude Sxx = 25, et la somme des carrés pour les notes d’examen Syy = 100, calculez le coefficient de corrélation r.

Hint: Divisez la somme des produits par la racine carrée du produit des sommes individuelles des carrés.

The full worked solution stays in the interactive walkthrough.

Where it shows up

Real-World Context

Dans le contexte de Corrélation entre la taille et la pointure, Corrélation (PMCC) sert à transformer les mesures en une valeur interprétable. Le résultat est important parce qu'il aide à relier le calcul à la forme, au taux de variation, à la probabilité ou à la contrainte du modèle.

Study smarter

Tips

  • Visualisez toujours d’abord les données avec un nuage de points pour confirmer qu’une tendance linéaire existe.
  • Méfiez-vous des valeurs aberrantes, car elles peuvent fortement gonfler ou réduire la valeur de r.
  • Rappelez-vous qu’une corrélation nulle implique l’absence de relation linéaire, mais une relation non linéaire peut tout de même exister.

Avoid these traps

Common Mistakes

  • Confondre corrélation et causalité.
  • r > 1 (erreur de calcul).

Common questions

Frequently Asked Questions

Le PMCC r de Pearson mesure la force et la direction de l'association linéaire entre deux variables, allant de -1 à 1.

Appliquez cette formule lorsque vous analysez des données quantitatives appariées pour voir si une variation d’une variable correspond à une variation proportionnelle d’une autre. Elle est spécifiquement conçue pour les associations linéaires et suppose que les données proviennent d’une distribution normale bivariée.

Ce coefficient est un pilier de la modélisation prédictive, permettant aux scientifiques d’identifier des motifs dans les données climatiques, aux économistes de couvrir le risque sur les marchés financiers et aux sociologues de trouver des liens entre des facteurs démographiques. Il fournit une base mathématique objective pour conclure si deux phénomènes sont statistiquement liés ou indépendants.

Confondre corrélation et causalité. r > 1 (erreur de calcul).

Dans le contexte de Corrélation entre la taille et la pointure, Corrélation (PMCC) sert à transformer les mesures en une valeur interprétable. Le résultat est important parce qu'il aide à relier le calcul à la forme, au taux de variation, à la probabilité ou à la contrainte du modèle.

Visualisez toujours d’abord les données avec un nuage de points pour confirmer qu’une tendance linéaire existe. Méfiez-vous des valeurs aberrantes, car elles peuvent fortement gonfler ou réduire la valeur de r. Rappelez-vous qu’une corrélation nulle implique l’absence de relation linéaire, mais une relation non linéaire peut tout de même exister.

References

Sources

  1. Wikipedia: Pearson product-moment correlation coefficient
  2. Probability and Statistics for Engineers and Scientists by Walpole, Myers, Myers, Ye (9th Edition)
  3. Moore, David S., and George P. McCabe. Introduction to the Practice of Statistics.
  4. Introduction to the Practice of Statistics by David S. Moore, George P. McCabe, Bruce A. Craig
  5. Statistical Methods for the Social Sciences by Alan Agresti
  6. Wikipedia article "Pearson correlation coefficient
  7. AQA A-Level Mathematics — Statistics (Bivariate Data)