[PDF] Corrigé

mod`ele linéaire avec n'importe quelle méthode d'estimation (calculer l'équation d' iii) en estimant la pente de la droite de régression aux moindres carrés :

[PDF] Régression linéaire - Laboratoire de Probabilités, Statistique et

le modèle de régression linéaire est inadapté, la variable x n'explique pas Exercice 1 10 (Régression simple) Cet exercice est corrigé en annexe, sujet de

CORRIGÉ TD 9 : Régression linéaire Exercice 1 : On reprend l'exemple des 5 des moindres carrés ordinaires, l'équation de la droite de régression de

[PDF] Exercices sur le modèle de régression linéaire simple

(vii) Construire l'intervalle de confiance au niveau de confiance de 95 pour le paramètre β (viii) Calculer le coefficient de détermination et effectuer le test de

[PDF] T D n 10 Correction de Régression linéaire multiple

Avant de lire le corrigé de cet exercice, il serait préférable de vérifier toutes les hypothèses du modèle, à savoir les trois hypothèses du modèles linéaire gaussien

[PDF] TD Régression Linéaire : Corrigé des exercices 4 et 8

l'égalité a = 0, i e on conclue que la droite de régression est pertinente 3 Exercice 8: résumé des valeurs numériques : ¯x ¯y s2 x

[PDF] Synthèse de cours exercices corrigés - ACCUEIL

EXERCICE 1 RÉGRESSION LINÉAIRE AVEC EXCEL Énoncé Estimez un modèle linéaire expliquant le taux de croissance de la consommation réelle

[PDF] Régression avec R Correction des exercices - Springer

1 Régression linéaire simple Exercice Exercice 1 3 (Variance des estimateurs) Considérons un autre estimateur ˜β2 linéaire en yi et sans biais, c'est-à-dire

[PDF] TD de régression linéaire simple - Mathématiques à Angers

Le but de cet exercice est de comparer la méthode des moindres carrés et la l' hypothèse d'un modèle de regréssion linéaire simple du type yi = β0 + β1xi + ϵi

[PDF] Exercices : Mod`ele de régression linéaire simple et multiple

Mod`ele de régression linéaire simple et multiple Exercice 1 On a relevé pour différents pays le PIB par habitant en 2004 X (en dollars) et le taux brut de

Universite Laval

Faculte des sciences et de genie

Departement de mathematiques et de statistiqueSTT-2902

Automne 2012

Emmanuelle Reny-NolinCorrige - Serie 3

Regression lineaire simple

Exercice 1 - Densite europeenne

a)y=0,0001x+1,9583 0

102030405060708090

0 100000 200000 300000 400000 500000 600000

Population(millionsd'habitants)

Superficie(km2)

PopulationenfonctiondelasuperficieOn voit qu'il y a probablement une relation lineaire croissante entre la population et

la supercie. Par contre, il est clair que la variance n'est pas constante autour de la droite (les residus acheraient un entonnoir ouvert a droite). On peut donc ajuster un modele lineaire avec n'importe quelle methode d'estimation (calculer l'equation d'une droite), mais on ne peut pas associer de marge d'erreur aux estimations des moindres carres comme on le ferait si tous les postulats etaient respectes. b) Esti mationde la densit emo yennede la p opulationen Europ e: i) en calculan tla mo yennedes 27 densit es: 27P
i=1y i=xi27 = 166;28 hab/km2 Ce calcul donne un poids egal a chaque pays. C'est la moyenne des densites des pays d'Europe, donc c'est la densite moyenne par pays. Les petits pays, ayant souvent une grande densite, ont plus de poids dans ce calcul. ii) en calculan tla p opulationtotale d es27 pa ys,et en la divisan tpar la sup ercie totale des 27 pays : 27X
i=1y i. 27X
i=1x i= 112;95 hab/km2

Ce calcul donne un poids egal a chaque km

2de territoire. Les grands pays ont

plus de poids dans ce calcul. Cette formule ne tient pas compte des divisions1

Universite Laval

Faculte des sciences et de genie

Departement de mathematiques et de statistiqueSTT-2902

Automne 2012

Emmanuelle Reny-Nolinpolitiques. Si l'Europe etait un pays, ce serait sa densite de population. Bien s^ur,

cette densite n'est pas homogene. iii) e nestiman tla p ented ela droite de r egressionaux moindres carr es: 27P
i=1x iyi27xy 27
P i=1x2i27x

2= 100;74 hab/km2

Ce calcul donne une estimation de l'augmentation moyenne de la population lorsque le territoire augmente d'un km

2. Cette estimation ne correspond pas exac-

tement a la valeur en a), car elle est calculee en minimisant l'erreur de prediction de la population a partir d'une supercie connue (les distances verticales par rap- port a la droite). Si la droite passait par 0 exactement, ce serait une facon d'envisager la densite "moyenne" (et on n'en est pas loin, puisque ^0= 1;96).A titre informatif, on peut forcer la droite de regression a passer par 0 (en minimisant la somme du carre des erreurs du modeleYi=1xi+"i), on obtient alors l'estimation suivante pour la pente : 27P
i=1x iyi27 P i=1x2i= 106;84 Exercice 2 - Drill, baby, drill! (Comme disait Sarah Palin) a) S XY=nP i=1(XiX)(YiY) nP i=1(XiYiXiYYiX+XY) nP i=1X iYiY nP i=1X iX nP i=1Y i+nXY nP i=1X iYiY(nX)X(nY) +nXY nP i=1X iYinXY 2

Universite Laval

Faculte des sciences et de genie

Departement de mathematiques et de statistiqueSTT-2902

Automne 2012

Emmanuelle Reny-Nolinb)

S XY=nP i=1(XiX)(YiY) nP i=1(XiX)YinP i=1(XiX)Y nP i=1(XiX)YiY nP i=1(XiX) nP i=1(XiX)YiY(0) nP i=1(XiX)Yi c) @S@

0= 0 sinP

i=1Y i=n^0+^1nP i=1X i

On isole

^0et on obtient^

0=Y^1X.

@S@

1= 0 sinP

i=1X iYi=^0nP i=1X i+^1nP i=1X2i

En remplacant

^0par^0=Y^1X, on obtient : n P i=1X iYiY nP i=1X i=^1(nP i=1X2iX nP i=1X i) n P i=1X iYinXY=^1(nP i=1X2inX 2)

On isole

^1et on obtient^

1=SXYS

XXd)En eet,

^1=SXYS XX=n P i=1(XiX)Yin P i=1(XiX)2 La principale consequence de cet etat de fait est que ^1suit une loi normale lorsqu'on suppose que lesYisuivent une loi normale (autour de la droite).3

Universite Laval

Faculte des sciences et de genie

Departement de mathematiques et de statistiqueSTT-2902

Automne 2012

Emmanuelle Reny-NolinExercice 3 - Dans le ventre de sa maman...

Modele 1 : Longevite en fonction de Gestation

Modele 2 : Longevite en fonction de ln(Gestation)

Modele 3 : ln(Longevite) en fonction de Gestation

Modele 4 : ln(Longevite) en fonction de ln(Gestation)a)Se lonles quatre graphiques de disp ersion,le mo dele4 est clairemen tcelui qui pr esente

la relation la plus lineaire, avec une variance a peu pres constante pour toutes les valeurs dex.051015202530354045

0 100 200 300 400 500 600 700

Y=Longévitémoyenne(années)

x=Duréedegestation(jours)

Modèle1:Yvsx

051015202530354045

Y ln(x)

Modèle2:Yvsln(x)

0,000,501,001,502,002,503,003,504,00

0 100 200 300 400 500 600 700

ln(Y) x

Modèle3:ln(Y)vsx

0,000,501,001,502,002,503,003,504,00

2,00 2,50 3,00 3,50 4,00 4,50 5,00 5,50 6,00 6,50 7,00

ln(Y) ln(x)

Modèle4:ln(Y)vsln(x)b)

Appellation dans Excel Symbole FormuleCoeff. de determination multiplercoe. de correlation echantillonnal

Cov(X;Y)S

XSY=SXYpS

XXSY YCoeff. de determination R^ 2R21SSESST

=SSRSST =r2Coeff. de determination R^ 2R2ajuste1SSE=(n2)SST=(n1)= 1MSES 2y4

Universite Laval

Faculte des sciences et de genie

Departement de mathematiques et de statistiqueSTT-2902

Automne 2012

Emmanuelle Reny-Nolinc)

Modele 1 : Y en fonction de XR2= 0:3275

Modele 2 : Y en fonction de ln(X)R2= 0:3925

Modele 3 : ln(Y) en fonction de XR2= 0:3535

Modele 4 : ln(Y) en fonction de ln(X)R2= 0:5883Le modele 4 est encore privilegie, car c'est celui pour lequel la proportion de variabilite

expliquee par le modele est la plus grande. d)2=MSE= 0:2000 e) mo yennedes r esidus= 3:4710160 et ecart-type des residus = 0:4413. On aurait pu trouver ces valeurs sans utiliser la liste des residus, car la moyenne des ecarts est toujours 0, et la variance echantillonnale des residus correspond a une petite transformation duMSE, soit s 2"=n P i=1(^"i")2(n1)=n P i=1([yi^yi]0)2(n1)=(n2)MSE(n1)

Exercice 4 - Jouons avec les Y

a) i)

M ethodede Ma yer:

Deux points moyens :P1= (19;5;3;0) etP2= (44;17;8;3)

Equation de la droite :^Y1= 0;2162x1;2329

ii)

M ethodem ediane-mediane:

Trois points medians :P1= (14;5;2;1),P2= (32;5;1) etP3= (50;5;9;4)

Moyenne des points medians : (32;33;5;50)

Equation de la droite :^Y1= 0;2028x1;0565

b) La p entec hangerade signe, mais aura la m ^emev aleurabsolue. P ourl'ordonn ee s l'origine, les calculs sont necessaires : i) Equation de la droite de Mayer :^Y2=0;2162x+ 12;5329 ii) Equation de la droite mediane-mediane :^Y2=0;2028x+ 12;0565 c) Non, les v aleursde Ysont liees aux valeurs deX. On ne peut pas separer les valeurs d'un m^eme individu. On ordonne selonXet lesYsuivent.5

Universite Laval

Faculte des sciences et de genie

Departement de mathematiques et de statistiqueSTT-2902

Automne 2012

Emmanuelle Reny-NolinExercice 5 - Un air de deja vu... a) On sait que la droite de r egressionpasse par ( x;y) = (0;6;4;15). On donne un autre point dans la question, soit (0;^0) = (0;2;335):On peut donc evaluer la pente de la droite : ^1=yx=4;152;3350;60= 3;025

L'equation de la droite de regression :

^Y=^0+^1x= 2;335 + 3;025x b)SXX= (n1)s2X= 90;0889 = 0;8001 S

Y Y= (n1)s2Y= 90;8206 = 7;388

MSE=SSE=(n2) = 0;0645=8 = 0;00806

Erreur-type(

^0) :sMSE 1n +x 2S XX =s0;00806110 +0;620;8001 = 0;0666

Erreur-type(

^1) :rMSE S

XX=r0;008060;8001= 0;1004

c) Il y a deux fa consde r epondre acette question. Il s'agit d'un test unilat erals ur1: H

0:1= 3

H 1:1>3

1) Test d'hypothese sur la pente :On construit une statistique de Student en se basant sur le fait que

^1N 1;2S XX

SiH0est vraie, alorsT0=^13err:type(^1)=^13pMSE=S

XXtn2.

Puisquetobs=3:02530;1004= 0:249 n'est pas superieure a la valeur critiquet;n2= t

0:05;8= 1;86, on ne rejette pasH0.

2) Intervalle de conance sur la pente :Un intervalle de conance de niveau 1estequivalent a un testbilateralde seuilsur

un parametre, car il a deux bornes. La zone de rejet du test unilateral (H1:1>3)6

Universite Laval

Faculte des sciences et de genie

Departement de mathematiques et de statistiqueSTT-2902

Automne 2012

Emmanuelle Reny-Nolinexclut les 5% des valeurs les plus improbables de la distribution de ^1sousH0a l'extremitedroitedu spectre. L'intervalle de conance correspondant devra "exclure"

5% des valeurs a chaque extremite du spectre. Il aura donc un niveau de 90%.

1t8;0;05err:type(^1) = 3;0251;860;1004 = [2;838;3;212]

On rejetteraitH0si toutes les valeurs de l'intervalle de conance etaient superieures a 3. C'est donc la borne inferieure qui determine notre decision. On ne peut donc pas conclure que la pente de la droite est superieure a 3 au seuil= 5%. d)R2=SSRSST = 1SSESST = 1SSES

Y Y= 10;06457;388= 0;9913:

e) In tervallede pr edictionp ourune observ ationfuture : ^y0t8;0;025rMSE 1 + 1n +(x0x)2S XX

2;335 + 3;025(0;9)2:306r0:00806

1 + 110
+(0;90;6)20;8001

5;0580;228

[4;830;5;286] f) i) Si on a vaitc hoisiune quan tited'a ntibiotique egale a0,7, l'in tervalleaurait ete plus court carx0aurait ete plus proche de la moyenne. ii) Si on a vaitc hoisi= 0:01, l'intervalle aurait ete plus long, car le quantilet8;0;005 aurait ete plus grand. iii) S ion a vaitutilis eune taille d' echantillonde 20 unit es,l'in tervalleaurait eteplus court, carnetSXXseraient plus grands ettn2;0;025serait plus petit. iv) S ion a vaitconstruit l'in tervallep ourestimer la densit eoptique mo yennede tous les tubes ayant recu une quantite d'antibiotique egale a 0,9, l'intervalle aurait ete plus court, car on aurait choisi la formule de l'intervalle de conance pour E(Yjx0), qui tient seulement compte de l'erreur d'estimation du point sur la droite. g) i) Ce tub ea re cux1;5sX= 0;61;5(0;298) = 0;153 unite d'antibiotique. ii) densit eoptique pr edite= 2,797 iii) C ettev aleurse situe a1,493 ecart-typede la densit eoptique mo yenne iv)

1 ;5r= 1;493!r= 0;995. On peut verier qu'il s'agit de la racine carree

positive deR2.7

Universite Laval

Faculte des sciences et de genie

Departement de mathematiques et de statistiqueSTT-2902

Automne 2012

Emmanuelle Reny-Nolinh)

i) La mo yennedes xiet desyirestera exactement la m^eme dans les deux cas. ii) L' equationde la droite de r egressionrestera inc hangee. On peut voir facilement queSxxsera deux fois plus petit, car chaque ecart est present une seule fois dans la somme au lieu de deux. S xysera aussi deux fois plus petit. Pour s'en convaincre, prenons les deux premiers termes de la somme avant reduction des donnees : (0:2x)(2:9y) + (0:2x)(3:0y) = (0:2x)(2:9 + 3:02y) Ils sont maintenant remplaces par (0:2x)(2:95y) dans la somme apres reduction des donnees. Idem pour les huit autres termes deSxy. iii) L' estimationde la v ariancea utourde la droite sera consid erablementr eduiteet par consequent la marge d'erreur sur les predictions sera faussement diminuee. Une bonne partie de la variabilite naturelle dans les observations est occultee par la mise en commun desYayant la m^eme valeur deX.

Exercice 6 - Ma cabane au Canada

Cov(X;Y) = 374225

r(X;Y) = 0;77 a) O nd ecided'exprimer le prix des maisons en milliers de dollars plut^ otqu'en dollars.

PosonsW=Y=1000.

Cov(X;W) =Cov

X;Y1000

=11000

Cov(X;Y) = 374;225

r(X;W) =Cov(X;W)pV ar(X)V ar(W)=Cov(X;Y=1000)pV ar(X)V ar(Y=1000)=1=1000Cov(X;Y)pV ar(X) (1=1000)2V ar(Y)

Cov(X;Y)pV ar(X)V ar(Y)=r(X;Y) = 0;77

b) O nv eutma intenantexprim erle temps en nom bred'ann ees ecouleesdepuis 1980.

PosonsT=X1980.8

Universite Laval

Faculte des sciences et de genie

Departement de mathematiques et de statistiqueSTT-2902

Automne 2012

Emmanuelle Reny-NolinCov(T;Y) =Cov(X1980;Y) =Cov(X;Y) = 374225 r(T;Y) =Cov(X1980;Y)pV ar(X1980)V ar(Y)=Cov(X;Y)pV ar(X)V ar(Y)=r(X;Y) = 0;779quotesdbs_dbs20.pdfusesText_26

[PDF] [PDF] Corrigé - Série 3 Régression linéaire simple Exercice 1 - Densité

Universite Laval

Faculte des sciences et de genie

Automne 2012

Emmanuelle Reny-NolinCorrige - Serie 3

Regression lineaire simple

Exercice 1 - Densite europeenne

102030405060708090

0 100000 200000 300000 400000 500000 600000

Population(millionsd'habitants)

Superficie(km2)

Ce calcul donne un poids egal a chaque km

2de territoire. Les grands pays ont

Universite Laval

Faculte des sciences et de genie

Automne 2012

2= 100;74 hab/km2

2. Cette estimation ne correspond pas exac-

Universite Laval

Faculte des sciences et de genie

Automne 2012

Emmanuelle Reny-Nolinb)

0= 0 sinP

On isole

0=Y^1X.

1= 0 sinP

En remplacant

On isole

1=SXYS

XXd)En eet,

Universite Laval

Faculte des sciences et de genie

Automne 2012

Modele 1 : Longevite en fonction de Gestation

Modele 2 : Longevite en fonction de ln(Gestation)

Modele 3 : ln(Longevite) en fonction de Gestation

0 100 200 300 400 500 600 700

Y=Longévitémoyenne(années)

Modèle1:Yvsx

051015202530354045

Modèle2:Yvsln(x)

0,000,501,001,502,002,503,003,504,00

0 100 200 300 400 500 600 700

Modèle3:ln(Y)vsx

0,000,501,001,502,002,503,003,504,00

2,00 2,50 3,00 3,50 4,00 4,50 5,00 5,50 6,00 6,50 7,00

Modèle4:ln(Y)vsln(x)b)

Cov(X;Y)S

XSY=SXYpS

XXSY YCoeff. de determination R^ 2R21SSESST

Universite Laval

Faculte des sciences et de genie

Automne 2012

Emmanuelle Reny-Nolinc)

Modele 1 : Y en fonction de XR2= 0:3275

Modele 2 : Y en fonction de ln(X)R2= 0:3925

Modele 3 : ln(Y) en fonction de XR2= 0:3535

Exercice 4 - Jouons avec les Y

M ethodede Ma yer:

Equation de la droite :^Y1= 0;2162x1;2329

M ethodem ediane-mediane:

Moyenne des points medians : (32;33;5;50)

Equation de la droite :^Y1= 0;2028x1;0565

Universite Laval

Faculte des sciences et de genie

Automne 2012

L'equation de la droite de regression :

Y Y= (n1)s2Y= 90;8206 = 7;388

MSE=SSE=(n2) = 0;0645=8 = 0;00806

Erreur-type(

Erreur-type(

XX=r0;008060;8001= 0;1004

0:1= 3

1) Test d'hypothese sur la pente :On construit une statistique de Student en se basant sur le fait que

SiH0est vraie, alorsT0=^13err:type(^1)=^13pMSE=S

XXtn2.

0:05;8= 1;86, on ne rejette pasH0.

2) Intervalle de conance sur la pente :Un intervalle de conance de niveau 1estequivalent a un testbilateralde seuilsur

Universite Laval

Faculte des sciences et de genie