[PDF] [PDF] 12 Régression linéaire simple - GERAD





Previous PDF Next PDF



[PDF] Cours 12 : Corrélation et régression - uOttawa

Test sur le coefficient de corrélation de Pearson explique la variance en Y et cette quantité est donnée par r2 Autrement dit si nous



[PDF] Méthode des moindres carrés

son coefficient de corrélation linéaire défini par Parfois on préf`ere calculer non plus rxy mais son carré noté R2 = rxyrxy car on a la relation



[PDF] Régression linéaire simple

(8) Coefficient de détermination R2 ou carré du coefficient de corrélation 4 Inférence 4 1 Loi des paramètres Les estimateurs ?



[PDF] Chapitre 4 : Régression linéaire

Remarque : La régression di ère de l'analyse de la corrélation où toutes les une valeur de R2 proche de 1 (voir chapitre corrélation de Pearson) est 



[PDF] Analyse de corrélation - GILLES HUNAULT (giluno)

Le coefficient de corrélation linéaire simple dit de Bravais-Pearson (ou de avec ˆr2 = 0 81 on peut dire que 81 de la variance de Y est expliquée par 



[PDF] 12 Régression linéaire simple - GERAD

Le coefficient R2 mesure le pourcentage de la variabilité totale SY Y qui est expliquée par le mod`ele Si R2 est proche de 1 alors le mod`ele semble adéquat



[PDF] Value of r2 in Statistical Analysis by Pearson Correlation Coefficient

1 nov 2017 · During interpretation of correlation coefficient we should consider the coefficient of determination (r2) value along with r and p values The 



[PDF] Grain 7 : Régression Linéaire - Fun Mooc

Dans le grain 2 la notion de corrélation entre deux variables a été abordée Un indicateur de la qualité est le coefficient de détermination R2 défini 



[PDF] Le modèle linéaire avec R : fonction lm()

R2 : coefficient de determination avant de le définir il faut définir 3 sommes de carrés On partitionne la variation totale de Y (SST) en 2 composantes 



[PDF] 243 Le coefficient de corrélation multiple (ou coefficient de

r2 = 0 9699 La matrice de variance-covariance des coefficients b est: b0 24 75 0 9 -22 5 Page 40 2 Corrélation et régression 40 b1 0 9 0 36 -3 6 b2 -22 5 



[PDF] Cours 12 : Corrélation et régression

Pour calculer le coefficient de corrélation il faut premièrement pouvoir calculer la covariance entre deux échantillons On se rappelle que la variance 



[PDF] Chapitre 4 : Régression linéaire

- si R2 = 1 les points sont alignés sur la droite la relation linéaire explique toute la variation - une valeur de R2 proche de 1 (voir chapitre corrélation 



[PDF] Méthode des moindres carrés

Ces jeux de données ont été choisit de mani`ere a définir la même droite de regressions et avec le même coefficient de corrélation R2 De gauche `a droite et 



[PDF] Régression linéaire

Exemples : Voici quatre jeux de données choisis de mani`ere `a définir la même droite de régression et avec le même coefficient de corrélation linéaire ? De 



[PDF] Régression linéaire - LPSM

Le coefficient de détermination R2 est égal au carré du coefficient de corrélation linéaire entre les variables x et y ce qui donne : R2 =



[PDF] 12 Régression linéaire simple - GERAD

Le coefficient de corrélation ? est estimé ponctuellement par r Exemple 1 : r ? 99 81 MTH2302D: régression 45/46 Page 



[PDF] Régression linéaire multiple ou modèle gaussien

Le coefficient de détermination R2 = 1?SSE/SST directement lié à la dé- viance (SSE) est aussi un indice de qualité mais qui a la propriété d'être mono- tone 



[PDF] Régression linéaire simple

(8) Coefficient de détermination R2 ou carré du coefficient de corrélation 4 Inférence 4 1 Loi des paramètres Les estimateurs ?



coefficient de détermination Lexique de mathématique

Le coefficient de détermination (R² soit le carré du coefficient de corrélation linéaire r) est un indicateur qui permet de juger la qualité d'une 

  • Comment interpréter le R2 ?

    Interprétation des valeurs de R carré? Ce coefficient est compris entre 0 et 1, et croît avec l'adéquation de la régression au modèle: – Si le R² est proche de zéro, alors la droite de régression colle à 0% avec l'ensemble des points donnés.
  • Comment calculer le coefficient de corrélation R2 ?

    Par ailleurs, dans le cas de la régression linéaire simple, le R2 est égal au coefficient de corrélation de Pearson au carré, entre la variable réponse (Y), et la variable prédictive (X).
  • Comment calculer coefficient de corrélation R ?

    Le coefficient de corrélation �� détermine l'intensité de la corrélation entre deux variables �� et �� et est calculé en utilisant la formule �� = �� ? �� �� ? ? ? �� ? �� ? ? �� ? �� ? ? ? �� ? ? �� ? �� ? ? ? �� ? , ? ? ? ? où �� est le nombre de valeurs appariées de �� et �� .
  • Le coefficient de détermination est noté R². Dans le cas d'une corrélation linéaire, R² = r², où r est le coefficient de corrélation linéaire. À noter que R² n'est le carré du coefficient de corrélation r que dans le cas particulier de la régression linéaire.

1/62/6 3/6 4/6 5/6 6/6

12. Regression lineaire simple

MTH2302D

S. Le Digabel,

Ecole Polytechnique de Montreal

A2017 (v2)

MTH2302D: regression1/46

1/62/6 3/6 4/6 5/6 6/6

Plan

1. Introduction

2. Regression lineaire simple

3. Estimation des parametres

4. Intervalles de conance et tests

5. Analyse des residus

6. Correlation

MTH2302D: regression2/46

1/62/6 3/6 4/6 5/6 6/6

1. Introduction

2. Regression lineaire simple

3. Estimation des parametres

4. Intervalles de conance et tests

5. Analyse des residus

6. Correlation

MTH2302D: regression3/46

1/62/6 3/6 4/6 5/6 6/6

Regression lineaire : introduction

But :etablir un lien entre une variable dependanteYet une variable independanteXpour pouvoir ensuite faire des previsions surYlorsqueXest mesuree.Exemple 1 L'analyse de la temperature de fonctionnement d'un procede chimique sur le rendement du produit a donne les valeurs suivantes pour la temperatureXiet le rendement correspondantYi:

Temperature

CRendement %Temperature

CRendement %

1004515070

1105116074

1205417078

1306118085

1406619089

MTH2302D: regression4/46

1/62/6 3/6 4/6 5/6 6/6

Exemple 1 (suite)

Le graphe ci-dessous represente les points(Xi;Yi)pour ces donnees et suggere une relation lineaire entreXetY.404 0 0 0 808

90901101301

01 0190

40

0 0 8918 0 3+4, -408MTH2302D: regression5/46

1/62/6 3/6 4/6 5/6 6/6

1. Introduction

2. Regression lineaire simple

3. Estimation des parametres

4. Intervalles de conance et tests

5. Analyse des residus

6. Correlation

MTH2302D: regression6/46

1/62/6 3/6 4/6 5/6 6/6

Modele lineaire

Denition

Unmodele de regression lineaire simpleest de la forme

Y=0+1X+"

ou I

Yest lavariable dependante(une v.a.).

I

0et1sont lescoecients(ordonnee a l'origine et pente).

I Xest lavariable independante(variable explicative). I "est uneerreuraleatoire.MTH2302D: regression7/46

1/62/6 3/6 4/6 5/6 6/6

Modele lineaire (suite)

L'esperance deYpour chaqueXest le point sur la droite d'equation E(YjX) =0+1X.

On suppose que

I

Pour chaque valeur deX, E(") = 0et V(") =2.

I "N(0;2). I

Les erreurs"sont independantes (non correlees).

On cherche a

I

Estimer les parametres0,1et2.

I Verier si le modele est adequat.MTH2302D: regression8/46

1/62/6 3/6 4/6 5/6 6/6

1. Introduction

2. Regression lineaire simple

3. Estimation des parametres

4. Intervalles de conance et tests

5. Analyse des residus

6. Correlation

MTH2302D: regression9/46

1/62/6 3/6 4/6 5/6 6/6

Parametres0et1

Supposons quenpaires d'observations(X1;Y1),(X2;Y2),:::, (Xn;Yn)ont ete faites. Substituant dans le modele lineaire, on obtient Y i=0+1Xi+"i)"i=Yi01Xi: Les coecients sont determines par la methode des moindres carres qui minimise la somme des carres des erreurs :

L(0;1) =nX

i=1(Yi01Xi)2: On resout le systeme de deux equations a deux inconnues rL(^0;^1) = 0.MTH2302D: regression10/46

1/62/6 3/6 4/6 5/6 6/6

Parametres0et1(suite)

rL(^0;^1) = 0)8

0=Y^1X

1=P n i=1XiYinXYP n i=1X2inX

2=SXYS

XXavec

IX=1n P n i=1XietY=1n P n i=1Yi. I

SXX=Pn

i=1(XiX)2=Pn i=1X2inX

2= (n1)S2.

I

SY Y=Pn

i=1(YiY)2=Pn i=1Y2inY 2. I

SXY=Pn

i=1(XiX)(YiY) =Pn i=1XiYinXY. Exemple 2 :retrouver ces formules.MTH2302D: regression11/46

1/62/6 3/6 4/6 5/6 6/6

Droite de regression pour l'exemple 1404

0 0 0 808

90901101301

01 0190+,--./0+1,23/+/1.41/002,-Voirchier Excel .

MTH2302D: regression12/46

1/62/6 3/6 4/6 5/6 6/6

Point de vue algebrique

I

Etant donnesnpoints de donnees

(X1;Y1);(X2;Y2);:::;(Xn;Yn)deR2, on essaie de trouver l'equation d'une droite qui passe par lesnpoints. I

Cette equation estY=0+1Xavec0;12R.

I

0et1devraient ^etre les solutions du systemeAx=bavec

A=2 6

6641X1

1X2......

1Xn3 7

775;x=0

1 ;b=2 6 664Y
1 Y 2... Y n3 7 775.
I

Resolution au sens des

moindres ca rres ^0;^1) = A>A

1A>b.MTH2302D: regression13/46

1/62/6 3/6 4/6 5/6 6/6

Proprietes de0et1

La droite de regression estimee est

^Y=^0+^1X.

Les variables aleatoires

^0et^1sont des estimateurs de l'ordonnee a l'origine0et de la pente1.Theoreme

1.E(^0) =0et E(^1) =1(estimateurs non biaises).

2.V(^0) =2"

1n +X 2S XX# et V(^1) =2S XX.

3.Cov(^0;^1) =2X

S XX.

MTH2302D: regression14/46

1/62/6 3/6 4/6 5/6 6/6

Parametre2

Rappel : le modele de regression estY=0+1X+"avec

"N(0;2).

La dierence entre la valeur estimee

^Yi=^0+^1Xiet la valeur observeeYiest appeleeresiduet est denoteeEi=^YiYi.

On denit

I

Lasomme des carres d^ue a l'erreurpar

SS E=nX i=1E 2i=nX i=1(^YiYi)2. I

Lasomme des carres d^ue a la regressionpar

SS R=nX i=1(^YiY)2=^21SXX=S2XYS XX.

MTH2302D: regression15/46

1/62/6 3/6 4/6 5/6 6/6

Parametre2(suite)

La quantiteSY Yrepresente la variabilite totale desYi. On peut la decomposer par S

Y Y=SST=SSE+SSR.Theoreme

1.E(SSE) = (n2)2.

2.^2=SSEn2MSEest donc un estimateur sans biais de2.MTH2302D: regression16/46

1/62/6 3/6 4/6 5/6 6/6

Exemple 1 (suite)

L'analyse de la temperature de fonctionnement d'un procede chimique sur le rendement du produit a donne les valeurs suivantes pour la temperatureXiet le rendement correspondantYi:

Temperature

CRendement %Temperature

CRendement %

1004515070

1105116074

1205417078

1306118085

1406619089

Voir chier Excel

MTH2302D: regression17/46

1/62/6 3/6 4/6 5/6 6/6

1. Introduction

2. Regression lineaire simple

3. Estimation des parametres

4. Intervalles de conance et tests

5. Analyse des residus

6. Correlation

MTH2302D: regression18/46

1/62/6 3/6 4/6 5/6 6/6

Distributions pour

^0et^1Theoreme

La statistique^00r

MS Eh1n +X 2S XXi suit une loi de Student an2degres de liberte.Theoreme

La statistique^11pMS

E=SXX suit une loi de Student an2degres de liberte.MTH2302D: regression19/46

1/62/6 3/6 4/6 5/6 6/6

Intervalles de conance pour0et1Theoreme

Intervalles de conance bilateraux au niveau de conance1 pour0et1:

0=^0t=2;n2v

uutMS E" 1n +X 2S XX#

1=^1t=2;n2rMS

ES

XX.Voirchier Excel .

MTH2302D: regression20/46

1/62/6 3/6 4/6 5/6 6/6

Intervalles de conance pour la droite de regression Il s'agit d'un intervalle de conance pour E(Y0jx0), la reponse moyenne a la valeurx0. Pourx0donne soit^Y0=^0+^1x0l'estimateur de E(Y0jx0).Theoreme Intervalle de conance pour E(Y0jx0)au niveau de conance 1:

E(Y0jx0) =^Y0t=2;n2sMS

E1n +(Xx0)2S XX

MTH2302D: regression21/46

1/62/6 3/6 4/6 5/6 6/6

Exemple 1 (suite)

Le calcul de l'intervalle de conance a 95% en chaque point x

0=Xi,i= 1;2;:::;10donne le tableau suivant :x

0100 110 120 130 140

^y045.56 50.39 55.22 60.05 64.88 limites1:301:100:930:790:71x

0150 160 170 180 190

^y069.72 74.55 79.38 84.21 89.04 limites0:710:790.931:101:30Voirchier Excel .

MTH2302D: regression22/46

1/62/6 3/6 4/6 5/6 6/6

Exemple 1 (suite)

a partir des donnees du tableau precedent, on a trace l'intervalle de conance pour la droite de regression :44040 40

0 40 0 40 084080

091
099
093
09+ 094
09 09 09 098
09

0,-../010,2-3400,002/520113-.01-6178992-:;016278992-:;0MTH2302D: regression23/46

1/62/6 3/6 4/6 5/6 6/6

Intervalles de prevision

Soitx0une valeur quelconque. La valeur correspondante deYest Y

0=Yjx0=0+1x0+"0. On estime ponctuellementY0par^Y0=^0+^1x0.

La statistique

Y 0^Y0r MS Eh 1 +1n +(Xx0)2S XXi suit une loi de Student an2degres de liberte.Theoreme

Intervalle de prevision pour la valeur deYenx0:

Y

0=^Y0t=2;n2sMS

E 1 +1n +(Xx0)2S XX

MTH2302D: regression24/46

1/62/6 3/6 4/6 5/6 6/6

Remarques : IC vs IP

ILes longueurs des deux types d'intervalles croissent lorsquex0 s'eloigne deX. I L'IC de la droite de regression ne convient pas pour eectuer des previsions puisqu'il concerne la vraie reponse moyenne au pointX=x0, soit un parametre de la population, et non une nouvelle observation, i.e. une nouvelle valeur pour la v.a.Y. I L'IP enx0est toujours plus grand que l'IC enx0car il depend de l'erreur associee aux futures observations. I L'IP prend en compte une nouvelle observation, d'ou une augmentation de2'MSEde la variance. I L'IP n'est valide que pourunenouvelle observation a la fois. Pour une serie de nouvelles observations, il faut mettre a jour le modele au fur et a mesure. I Voir c hierExcel .MTH2302D: regression25/46

1/62/6 3/6 4/6 5/6 6/6

Exemple 1 (suite)

a partir des donnees du tableau precedent, on a trace l'intervalle de prevision pour= 5%:40

0 0 080440 9 9894494

94 94 94891491

91 93+,,-./30+12.3.0-30.//1+,/+4/56770+89/4056770+89MTH2302D: regression26/46

1/62/6 3/6 4/6 5/6 6/6

Tests d'hypotheses pour0

La distribution

t

0=^00;0r

MS Eh1n +X 2S XXi Tn2 permet de tester des hypotheses du type H

0:0=0;0

H

1:06=0;0

On rejetteH0au seuilsijt0j> t=2;n2.MTH2302D: regression27/46

1/62/6 3/6 4/6 5/6 6/6

Tests d'hypotheses pour1

La distribution

t

0=^11;0pMS

E=SXXTn2

permet de tester des hypotheses du type H

0:1=1;0

H

1:16=1;0

On rejetteH0au seuilsijt0j> t=2;n2.MTH2302D: regression28/46

1/62/6 3/6 4/6 5/6 6/6

Tableau d'analyse de la variance

L'information donnee par les valeursSY Y,SSEetSSRest presentee dans untableau d'analyse de la variance:

Source deSommeNombreMoyenne

variationdes carresde d.d.l.des carresF

0RegressionSS

R1MS

R=SSR1MS

RMS

EResidusSS

En2MS

E=SSEn2TotalSS

T=SY Yn1MTH2302D: regression29/46

1/62/6 3/6 4/6 5/6 6/6

Signication de la regression

Il s'agit de tester les hypotheses

H

0:1= 0

H

1:16= 0

AccepterH0implique que l'on conclut qu'il n'y a pas de relation lineaire entreXetY. Ceci peut signier que I

La relation entreXetYn'est pas lineaire.

I

La variation deXin

ue peu ou pas sur la variation deY. Au contraire, rejeterH0implique que l'on conclut que la variation deXin ue sur la variation deY. Le critere est : rejeterH0au seuilsiF0> F;1;n2, ou encore si la valeur-Pcalculee est petite, avec valeur-P=P(F1;n2F0).MTH2302D: regression30/46

1/62/6 3/6 4/6 5/6 6/6

Exemple 1 : tableau d'analyse de la variance

Source deSommeNombreMoyenne

variationdes carresde d.d.l.des carresF

0RegressionSS

R= 1924:881MS

quotesdbs_dbs42.pdfusesText_42
[PDF] régression statistique

[PDF] nuage de points statistique

[PDF] exercice covariance statistique corrigé

[PDF] psychologie et pédagogie jean piaget

[PDF] pédagogie et éducation différence

[PDF] spallation cosmique

[PDF] nucléosynthèse primordiale

[PDF] la personne que j'admire le plus est ma mere

[PDF] nucléosynthèse des éléments chimiques

[PDF] nucléosynthèse interstellaire

[PDF] nucléosynthèse dans les étoiles

[PDF] nucléosynthèse explosive

[PDF] nucléosynthèse stellaire pdf

[PDF] recettes du 18ème siècle

[PDF] menu du 19 siecle