2 CORRÉLATION ET RÉGRESSION
Une corrélation est toujours comprise entre -1 et 1 inclusivement L'absence de corrélation n'implique pas l'indépendance entre les variables Elle implique uniquement l'absence de relation linéaire entre celles-ci Par contre, l'indépendance entre les variables implique l'absence de corrélation
Corrélation et régression linéaire 2
L’étude statistique d'une population peut porter simultanément sur plusieurs variables nécessaire de mesurer la liaison éventuelle entre ces variables e g : l'une augmente, l'autre augmente également ou l'une augmente, l'autre diminue, etc on va alors étudier les corrélations
Analyse de corrélation - Laboratoire ERIC
4 1 Liaison entre 2 ariablesv quantitatives Fig 1 1 Quelques types de liaisons entre 2 ariablesv Liaison linéaire négative Xet Y évoluent en sens inverse La pente est inchangée quelle que soit la aleurv de X Liaison monotone ositivep non-linéaire X et Y évoluent dans le même sens, mais la pente est di érente selon le niveau de X
Régression multiple : principes et exemples d’application
l’a vu Les équations se compliquent avec plusieurs régresseurs, deux méthodes distinctes permettent de résoudre les équations La première repose sur la connaissance des coefficients de corrélation linéaire simple de toutes les paires de variables entre elles, de la moyenne arithmétique et des écarts-types de toutes les variables
TD6 Corrélation et régression simple - Cogscinl
Comparer deux ou plusieurs moyennes entre elles La VI a plusieurs modalités – Relations : Étudier les rapports / les relations / les liens entre plusieurs variables Les variables sont continues Le taux de l'alcool, est-il corrélé avec les compétences de conduit? Si ou, dans quel sens ? 0 bières 1 bières D é v i a t i o n
Seance 3: Liaisons entre variables´ - univ-toulouse
Liaisons entre variables ordinales : corr´elation des rangs Liaison entre variable num´erique et variable qualitative Liaison entre deux variables qualitatives Objectifs Correlation des rangs de Spearman´ Correlation des rangs´ τ de Kendall Extension au cas de p variables Objectifs Contexte : liaison entre variables numeriques ou non´
PROC REG REGRESSION LINEAIRE SIMPLE OU MULTIPLE
entre les paramètres estimés CORRB édite la matrice de corrélation entre les paramètres estimés DW calcule le coefficient de Durbin-Watson VAR fixe la liste des variables retenues (y et x dans la régression simple ; y,x1,x2,x3 dans la régression multiple) En l’absence de cette instruction, toutes les variables sont retenues
[PDF] fonction de cout marginal
[PDF] régression multiple excel
[PDF] cours microeconomie
[PDF] microéconomie cours 1ere année pdf
[PDF] introduction ? la microéconomie varian pdf
[PDF] introduction ? la microéconomie varian pdf gratuit
[PDF] les multiples de 7
[PDF] les multiples de 8
[PDF] comment reconnaitre un multiple de 4
[PDF] numero diviseur de 4
[PDF] les multiples de 2
[PDF] diviseurs de 36
[PDF] les multiples de 4
[PDF] multiple de 18
TD6
Corrélation et régression simple
Lotje van der Linden
l.vanderlinden@cogsci.nlTD6: 17/03/20122Emploi du temps
SéanceDateThème
104/02/2016Introduction
Les statistiques descriptives
211/02/2016Le test t:
Comparer 2 moyennes
325/02/2016L'ANOVA simple :
Comparer >2 moyennes d'une seule VI
403/03/2016L'ANOVA factorielle :
Comparer >2 moyennes de plusiers VI
510/03/2016Continuation ANOVA
Preparer le ifichier csv
617/03/2016La régression simple et correlation
1 prédicteur
724/03/2016La régression multiple
Plusiers prédicteurs
831/03/2016(Les tests non-paramétriques)
Révisions
9??Examen sur table
TD6: 17/03/20123Planning
Aujourd'hui
Partie 1 :Théorie : La corrélationLa régression simplePartie 2 :Informatique : Exercices
Temps pour discuter vos TER
Libre PauseTD6: 17/03/20124La question de recherche
Deux types de questions de
recherche : -Diffférences :Comparer deux ou plusieurs
moyennes entre ellesLa VI a plusieurs modalités
-Relations :Étudier les rapports / les
relations / les liens entre plusieurs variables Les variables sont continuesLe taux de l'alcool, est-il corrélé avec les compétences de conduit? Si ou, dans quel sens ?0 bières1 bièresDéviationLe groupe qui a bu 2 bières montre plus de déviation que le groupe qui n'a pas bu de bière.TD6: 17/03/20125Arbre de décision
Aujourd'hui
TD 7TD6: 17/03/20126La méthode corrélationnelle
La problématique :
-Existe-t-il une relation entre le taux d'alcool et la conduit de voiture ?TD6: 17/03/20127La méthode corrélationnelle
La procédure :
-Sélectionner (de manière aléatoire)20 participants qui sont sortis un
samedi soir -Mesurer sur place :1.Leur déviation de conduit sur un
parcours (en cm.)2.Le taux d'alcool (en g par litre de
sang)TD6: 17/03/20128La méthode corrélationnelle
Les variables :
-On recueille deux variables continues au même moment -Au lieu de VI et VD, on parle souvent de :Une variable expliquée / variable critèreUne variable explicative / variable prédicteurParfois arbitraireQuestion de recherche : -Les deux variables, sont-elles corrélées ?TD6: 17/03/20129La méthode corrélationnelle
La représentation des données :
-Nuage de points 1 point par →sujet -Abscisse : la variable prédicteur -Ordonnée : la variable critère TD6: 17/03/201210La méthode corrélationnelle La méthode corrélationnelle versus la méthode expérimentale TD6: 17/03/201211La méthode corrélationnelle La méthode corrélationnelle versus la méthode expérimentale-Moins de contrôle -Plus de validité externe -Avant, le taux d'alcool était provoqué -Maintenant, le taux d'alcool d'alcool est invoqué -Pas le droit de tirer des conclusions sur la causalité -On teste: Si il existe une correlation/ un lien entre le taux d'alcool et les compétences de conduit Et non si il existe un efffet du taux d'alcool sur les compétences de conduit TD6: 17/03/201212La méthodologie corrélationnelle Si la variable prédicteur serait provoquée, même si elle est continue, ... -Ex. tâche de mémoire -Inlfluence du temps passé sur la récupération ? -A chaque participant on attribue une durée entre 10 et 40 minutes -Durée est continue on s'intéresse à une relation au lieu d'une →diffférence -Durée est provoqué droit de tirer des conclusions TD6: 17/03/201213Le coeiÌifiÌicient de corrélationLe coeiÌifiÌicient de corrélation : Pearson's r :-Exprime la relation linéaire entre deux variables
-Compris entre -1 et 1Le signe indique le sens de la corrélation :-Une valeur entre -1 et 0 une corrélation négative→Si Variable 1 augmente, Variable 2 diminue (ou vice versa)
-Une valeur de 0 pas de corrélation →-Une valeur entre 0 et 1 une corrélation positive →Si Variable 1 augmente, Variable 2 augmente aussi La valeur indique la force-Plus elle est proche de 1 (ou -1), plus la corrélation est forte -Plus elle est proche de 0, plus la corrélation est faible TD6: 17/03/201214Le coeiÌifiÌicient de corrélation r Corrélation positive :Pas de corrélation :Corrélation négative :Si la taille augmente, les
poids augmente aussiPas de rapport entre la taille de la tête et l'intelligenceSi l'activité physique augmente, le poids diminue TD6: 17/03/201215Le coeiÌifiÌicient de corrélationAttention ! Quelques pièges :
-Que peut-on conclure si r = 0Il n'existe pas de corrélation TD6: 17/03/201216Le coeiÌifiÌicient de corrélationAttention ! Quelques pièges :
-Que peut-on conclure si r = 0Il n'existe pas de corrélation ou...Il existe une corrélation dans la
vraie population mais pas dans l'échantillon TD6: 17/03/201217Le coeiÌifiÌicient de corrélationAttention ! Quelques pièges :
-Que peut-on conclure si r = 0Il n'existe pas de corrélation ou...Il existe une corrélation dans la
vraie population mais pas dans l'échantillon ou...La corrélation n'est pas linéaire
TD6: 17/03/201218Le coeiÌifiÌicient de corrélationAttention ! Quelques pièges :
-Que peut-on conclure si r difffère de 0 ?Il existe une vraie corrélation entre X et Y ou... TD6: 17/03/201219Le coeiÌifiÌicient de corrélationAttention ! Quelques pièges :
-Que peut-on conclure si r difffère de 0 ?Il existe une vraie corrélation entre X et Y ou...Une valeur aberrante est à la base
de la corrélation TD6: 17/03/201220Les statistiques inférentielles Appliquées aux corrélations-H0 : Il n'existe pas de corrélation entre les variables dans la population -H1 : Il existe une corrélation entre les variables dans la
populationSi p < 0,05 On rejette H
→0 en faveur de H1Si p > 0,05 On ne peut pas rejeter H →0TD6: 17/03/201221Interprétation et APA
JASP La corrélation entre la taille et les poids est significative (r = 0,873 ; p < 0,001, cf. Figure 1). TD6: 17/03/201222La régression linéaire simple Objectif : -Décrire les données dans le nuage de points par une seule ligne droite -De manière qui rend justice aux points individuels -La droite de régressionExprime la tendance linéaire dans les données recuilliesPermet de prédire des nouvelles observations
TD6: 17/03/201223La régression linéaire simple Objectif : -Décrire les données dans le nuage de points par une seule ligne droite -De manière qui rend justice aux points individuels -La droite de régressionExprime la tendance linéaire dans les données recuilliesPermet de prédire des nouvelles observations
→La pente de la droite de régression-a →L'ordonnée de l'origine (la valeur de intercept TD6: 17/03/201224Les statistiques inférentielles Appliquées à la régression linéaire simple -H0 : Dans la vraie population, l'activité physique est sans rapport avec les poids -H1 : L'activité physique prédit les poids
Si p < 0,05 On rejette H
→0 en faveur de H1Si p > 0,05 On ne peut pas rejeter H →0 TD6: 17/03/201225Les statistiques inférentiellesR2:-Varie entre 0 et 1
-Exprime la proportion de la variance de la variable critère qui est expliquée par la variable prédicteur -Ici : La proportion de la variable " Poids » qui est expliqué par la variable " Activité physique »TD6: 17/03/201226JASP
Corrélation-Signiificative et négative
TD6: 17/03/201227JASP
Régression linéaire simple
Variance en kg expliquée par les
minutes d'activité physique par jourTD6: 17/03/201228JASP
Régression linéaire simpleLa relation entre minutes d'activité et poids est significative (F (1, 38) = 23,78 ; p <
0,001, avec une R2 de 0,385).
TD6: 17/03/201229JASP
Régression linéaire simple
L'ordonnée de l'origine : Les poids en kg prédit lorsque minutes actif = 0TD6: 17/03/201230JASP
Régression linéaire simple
La pente : La diminution de poids prédit qui est associé à chaque minute d'activité supplémentaireTD6: 17/03/201231JASP
Régression linéaire simple
L'équation
Le poids prédit en kg = 104,46 - 0,204 x minutes actifs TD6: 17/03/201232Si l'équation n'est pas logique Parfois la pente et/ou l'ordonnée de l'origine ne sont pas interpretables en valeurs absolues L'ordonnée de l'origine nous donne un résultat qui représente une extrapolation tellement extrême qu'il perd toute utilité Prédire le poids pour quelqu'un avec une taille de 0 cm ? TD6: 17/03/201233Si l'équation n'est pas logique Parfois la pente et/ou l'ordonnée de l'origine ne sont pas interpretables en valeurs absolues Les valeurs x n'augmentent pas avec des étapes de 1Prédire l'augmentation en déviation pour chaque augmentation de 1/l ... ?Taux d'alcool mesuré en gramme d'alcool par litre de sang (g/l)
TD6: 17/03/201234Si l'équation n'est pas logiqueSolution :
CoeiÌifiÌicients de régression standardisés :-Une diffférence d'une unité pour X et Y représente une diffférence d'un
écart-type
TD6: 17/03/201235Si >2 variables
La relation entre le stress, la santé et l'activité physique stresssantéactivité physiqueTD6: 17/03/201236Si >2 variables
La relation entre le stress, la santé et l'activité physique Deux types de questions de recherches :-Étudier la relation linéaire entre : stresssanté stressactivité physique santéactivité physiqueJASP : Plusieurs corrélations
TD6: 17/03/201237
Si >2 variables
La relation entre le stress, la santé et l'activité physiqueDeux types de questions de recherches :-Prédire la variable de critère (ici par ex : le stress) à partir des variables
prédicteurs (ici par ex : la santé et l'activité physique) : santé stress activité physique JASP : Régression linéaire multiplemodèle