Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

corrélation linéaire : analyse de la dépendance de deux variables quantitatives

No description
by

Melanie Jaeck

on 5 September 2018

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of corrélation linéaire : analyse de la dépendance de deux variables quantitatives

Corrélation linéaire : analyse de la dépendance de deux variables quantitatives
le nuage de points
représentation graphique utilisée dans l'analyse de la dépendance de deux variables quantitatives :
le coefficient de corrélation
le Coefficient de corrélation, r, mesure la force du lien linéaire entre deux variables
La droite de régression
C'est la droite représentant le meilleur ajustement linéaire à un nuage de points (x; y)
principe de la droite de régression : régression des moindres carrés
la droite de régression, ou équation de prédiction, permet de prédire les valeurs (y’) de la variable dépendante (y), à partir des valeurs de la variable indépendante (x).
coefficients de la droite de régression
ici, on peut clairement voir que la consommation augmente avec le revenu.
Ce Graphique est composé de points (1 pour chaque unité statistique) :
Leurs coordonnées correspondent aux valeurs des deux variables quantitatives .
Il permet de voir si deux variables quantitatives sont suscpetibles d'être dépendantes ou liées, et aussi si le modèle linéaire est adapté pour décrire le lien entre ces
2 variables.
il semblerait qu'il existe une corrélation positive entre la consommation et le revenu.
le modèle* linéaire est la fonction mathématique la plus simple
son équation est
équation de la droite avec une pente = et une ordonnée à l'origine (ou constante) = : la valeur de y quand x=0
quand deux variables sont liées, mathématiquement on écrit :
y=f(x)
avec X la variable indépendante (explicative) et y la variable dépendante (expliQUée) .
Introduction à la corrélation linéaire
*un modèle est une approximation simple de la relation entre variables dans la population
est soit positif ou negatif
les deux variables évoluent dans la même direction:
quand x augmente, Y augmente aussi; et inversément
les deux variables évoluent dans des directions opposées :
quand x augmente, Y diminue; et inversément
Par exemple, ce graphique n'indique aucune corrélation linéaire entre les deux variables. Mais les deux variables sont tout de même liées (il existe une association distincte, non-linéaire mais quadratique, entre X et Y).
Il peut exister un lien entre deux variables quantitatives qui n'est pas caractérisé par le modèle linéaire !
=> Dans un nuage de points : Plus l'ovale est étroit, plus le lien de dépendance est fort, et plus particulièrement plus le modèle linéaire est approprié pour décrire le lien de dépendance entre les variables.
explication des différents éléments de la formule
coordonnées du couple i
moyenne de la variable indépendante x
écart type de la variable indépendante x
le Coefficient de corrélation est toujours compris entre -1 er 1 =>
nombre de couples (x,y) = taille de l'échantillon
moyenne de la variable dépendante y
écart type de la variable dépendante y
R positif => r>0 : corrélation linéaire positive : y augment quand x augmente.
R negatif => r<0 : corrélation linéaire negative : y diminue quand x augmente.
Plus r est proche de 1 (ou -1), plus la corrélation est forte
R proche de 0 indique l'absence de corrélation linéaire entre les variables
interprétation de la valeur du coefficient de corrélation basée sur deux déterminants:
son signe

son intensité
son Signe
son intensité
La corrélation linéaire n'implique pas toujours une relation de causalité. Il peut exister une corrélation linéaire sans causalité
droite de régression
Cependant, comme la corrélation n'est pas parfaite, il y a souvent des différences entre les prédictions (y’) et les valeurs observées (y) =>
erreurs de

prédiction appelées résidus
.
représentation graphique
la droite de régression ou équation de prédiction sera celle qui minimisera la somme des erreurs aux carrés
somme des erreurs au carré
qui donne la représentation graphique suivante :
sI modèle linéaire est bien approprié pour décrire le lien entre 2 variables, l'objectif est de trouver l'équation de la droite ,
appelée
équation de prédiction
, qui est la
meilleure droite, la plus proche des points dans un nuage de points.
il est possible de caractériser le lien entre les variables avec une droite . Même si les points ne sont pas exactement sur cette droite, ils se concentrent autour de celle-ci, et il est possible de les entourer d'un ovale étroit.
Full transcript