Régression et Corrélation

Introduction à la Régression et la Corrélation

La régression et la corrélation sont des outils statistiques essentiels pour analyser et comprendre les relations entre variables. Ces techniques sont largement utilisées dans de nombreux domaines, de l'économie à la biologie, en passant par les sciences sociales.

Définition : Corrélation

La corrélation mesure la force et la direction de la relation linéaire entre deux variables quantitatives. Elle est exprimée par le coefficient de corrélation de Pearson, noté r, qui varie entre -1 et 1.

Définition : Régression Linéaire

La régression linéaire est une méthode statistique qui modélise la relation entre une variable dépendante Y et une ou plusieurs variables indépendantes X. Dans le cas simple (régression linéaire simple), elle cherche à trouver la meilleure ligne droite qui décrit la relation entre X et Y.

Concepts clés

  • Coefficient de corrélation (r) : Mesure la force et la direction de la relation linéaire.
  • Coefficient de détermination (R²) : Indique la proportion de la variance de Y expliquée par X.
  • Pente (b) : Représente le changement moyen de Y pour chaque augmentation d'une unité de X.
  • Ordonnée à l'origine (a) : La valeur de Y lorsque X est égal à zéro.

Formules Importantes

Coefficient de corrélation :

r = Σ((x - x̄)(y - ȳ)) / √(Σ(x - x̄)² * Σ(y - ȳ)²)

Équation de régression linéaire :

Y = a + bX

où :

b = Σ((x - x̄)(y - ȳ)) / Σ(x - x̄)²

a = ȳ - bx̄

Exemple : Relation entre les heures d'étude et les notes

Supposons que nous ayons les données suivantes pour 5 étudiants :

Heures d'étude (X)Note (Y)
265
370
580
475
685

Après calculs :

• Coefficient de corrélation : r ≈ 0.97 (forte corrélation positive)

• Équation de régression : Y = 58 + 4.5X

Interprétation : Il existe une forte relation positive entre les heures d'étude et les notes. En moyenne, chaque heure d'étude supplémentaire est associée à une augmentation de 4,5 points de la note.

Calculateur de Régression Linéaire Simple