mod`ele linéaire avec n'importe quelle méthode d'estimation (calculer l'équation d' iii) en estimant la pente de la droite de régression aux moindres carrés :
Previous PDF | Next PDF |
[PDF] Corrigé - Série 3 Régression linéaire simple Exercice 1 - Densité
mod`ele linéaire avec n'importe quelle méthode d'estimation (calculer l'équation d' iii) en estimant la pente de la droite de régression aux moindres carrés :
[PDF] Régression linéaire - Laboratoire de Probabilités, Statistique et
le modèle de régression linéaire est inadapté, la variable x n'explique pas Exercice 1 10 (Régression simple) Cet exercice est corrigé en annexe, sujet de
[PDF] CORRIGÉ
CORRIGÉ TD 9 : Régression linéaire Exercice 1 : On reprend l'exemple des 5 des moindres carrés ordinaires, l'équation de la droite de régression de
[PDF] Exercices sur le modèle de régression linéaire simple
(vii) Construire l'intervalle de confiance au niveau de confiance de 95 pour le paramètre β (viii) Calculer le coefficient de détermination et effectuer le test de
[PDF] T D n 10 Correction de Régression linéaire multiple
Avant de lire le corrigé de cet exercice, il serait préférable de vérifier toutes les hypothèses du modèle, à savoir les trois hypothèses du modèles linéaire gaussien
[PDF] TD Régression Linéaire : Corrigé des exercices 4 et 8
l'égalité a = 0, i e on conclue que la droite de régression est pertinente 3 Exercice 8: résumé des valeurs numériques : ¯x ¯y s2 x
[PDF] Synthèse de cours exercices corrigés - ACCUEIL
EXERCICE 1 RÉGRESSION LINÉAIRE AVEC EXCEL Énoncé Estimez un modèle linéaire expliquant le taux de croissance de la consommation réelle
[PDF] Régression avec R Correction des exercices - Springer
1 Régression linéaire simple Exercice Exercice 1 3 (Variance des estimateurs) Considérons un autre estimateur ˜β2 linéaire en yi et sans biais, c'est-à-dire
[PDF] TD de régression linéaire simple - Mathématiques à Angers
Le but de cet exercice est de comparer la méthode des moindres carrés et la l' hypothèse d'un modèle de regréssion linéaire simple du type yi = β0 + β1xi + ϵi
[PDF] Exercices : Mod`ele de régression linéaire simple et multiple
Mod`ele de régression linéaire simple et multiple Exercice 1 On a relevé pour différents pays le PIB par habitant en 2004 X (en dollars) et le taux brut de
[PDF] exercice corrigé sur le barycentre
[PDF] exercice corrigé sur le bilan comptable
[PDF] exercice corrigé sur le bilan en comptabilité
[PDF] exercice corrigé sur le bilan hydrique
[PDF] exercice corrigé sur le champ electrostatique
[PDF] exercice corrigé sur le champ magnétique pdf
[PDF] exercice corrigé sur le diagramme de gantt
[PDF] exercice corrigé sur le diode
[PDF] exercice corrigé sur le pendule simple
[PDF] exercice corrigé sur le torseur de cohésion
[PDF] exercice corrigé sur les amplificateurs
[PDF] exercice corrigé sur les arbres binaires
[PDF] exercice corrigé sur les diode pdf
[PDF] exercice corrigé sur les ensembles
Universite Laval
Faculte des sciences et de genie
Departement de mathematiques et de statistiqueSTT-2902Automne 2012
Emmanuelle Reny-NolinCorrige - Serie 3
Regression lineaire simple
Exercice 1 - Densite europeenne
a)y=0,0001x+1,9583 0102030405060708090
0 100000 200000 300000 400000 500000 600000
Population(millionsd'habitants)
Superficie(km2)
PopulationenfonctiondelasuperficieOn voit qu'il y a probablement une relation lineaire croissante entre la population et
la supercie. Par contre, il est clair que la variance n'est pas constante autour de la droite (les residus acheraient un entonnoir ouvert a droite). On peut donc ajuster un modele lineaire avec n'importe quelle methode d'estimation (calculer l'equation d'une droite), mais on ne peut pas associer de marge d'erreur aux estimations des moindres carres comme on le ferait si tous les postulats etaient respectes. b) Esti mationde la densit emo yennede la p opulationen Europ e: i) en calculan tla mo yennedes 27 densit es: 27Pi=1y i=xi27 = 166;28 hab/km2 Ce calcul donne un poids egal a chaque pays. C'est la moyenne des densites des pays d'Europe, donc c'est la densite moyenne par pays. Les petits pays, ayant souvent une grande densite, ont plus de poids dans ce calcul. ii) en calculan tla p opulationtotale d es27 pa ys,et en la divisan tpar la sup ercie totale des 27 pays : 27X
i=1y i. 27X
i=1x i= 112;95 hab/km2
Ce calcul donne un poids egal a chaque km
2de territoire. Les grands pays ont
plus de poids dans ce calcul. Cette formule ne tient pas compte des divisions1Universite Laval
Faculte des sciences et de genie
Departement de mathematiques et de statistiqueSTT-2902Automne 2012
Emmanuelle Reny-Nolinpolitiques. Si l'Europe etait un pays, ce serait sa densite de population. Bien s^ur,
cette densite n'est pas homogene. iii) e nestiman tla p ented ela droite de r egressionaux moindres carr es: 27Pi=1x iyi27xy 27
P i=1x2i27x
2= 100;74 hab/km2
Ce calcul donne une estimation de l'augmentation moyenne de la population lorsque le territoire augmente d'un km2. Cette estimation ne correspond pas exac-
tement a la valeur en a), car elle est calculee en minimisant l'erreur de prediction de la population a partir d'une supercie connue (les distances verticales par rap- port a la droite). Si la droite passait par 0 exactement, ce serait une facon d'envisager la densite "moyenne" (et on n'en est pas loin, puisque ^0= 1;96).A titre informatif, on peut forcer la droite de regression a passer par 0 (en minimisant la somme du carre des erreurs du modeleYi=1xi+"i), on obtient alors l'estimation suivante pour la pente : 27Pi=1x iyi27 P i=1x2i= 106;84 Exercice 2 - Drill, baby, drill! (Comme disait Sarah Palin) a) S XY=nP i=1(XiX)(YiY) nP i=1(XiYiXiYYiX+XY) nP i=1X iYiY nP i=1X iX nP i=1Y i+nXY nP i=1X iYiY(nX)X(nY) +nXY nP i=1X iYinXY 2
Universite Laval
Faculte des sciences et de genie
Departement de mathematiques et de statistiqueSTT-2902Automne 2012
Emmanuelle Reny-Nolinb)
S XY=nP i=1(XiX)(YiY) nP i=1(XiX)YinP i=1(XiX)Y nP i=1(XiX)YiY nP i=1(XiX) nP i=1(XiX)YiY(0) nP i=1(XiX)Yi c) @S@0= 0 sinP
i=1Y i=n^0+^1nP i=1X iOn isole
^0et on obtient^0=Y^1X.
@S@1= 0 sinP
i=1X iYi=^0nP i=1X i+^1nP i=1X2iEn remplacant
^0par^0=Y^1X, on obtient : n P i=1X iYiY nP i=1X i=^1(nP i=1X2iX nP i=1X i) n P i=1X iYinXY=^1(nP i=1X2inX 2)On isole
^1et on obtient^1=SXYS
XXd)En eet,
^1=SXYS XX=n P i=1(XiX)Yin P i=1(XiX)2 La principale consequence de cet etat de fait est que ^1suit une loi normale lorsqu'on suppose que lesYisuivent une loi normale (autour de la droite).3Universite Laval
Faculte des sciences et de genie
Departement de mathematiques et de statistiqueSTT-2902Automne 2012
Emmanuelle Reny-NolinExercice 3 - Dans le ventre de sa maman...Modele 1 : Longevite en fonction de Gestation
Modele 2 : Longevite en fonction de ln(Gestation)
Modele 3 : ln(Longevite) en fonction de Gestation
Modele 4 : ln(Longevite) en fonction de ln(Gestation)a)Se lonles quatre graphiques de disp ersion,le mo dele4 est clairemen tcelui qui pr esente
la relation la plus lineaire, avec une variance a peu pres constante pour toutes les valeurs dex.0510152025303540450 100 200 300 400 500 600 700
Y=Longévitémoyenne(années)
x=Duréedegestation(jours)Modèle1:Yvsx
051015202530354045
Y ln(x)Modèle2:Yvsln(x)
0,000,501,001,502,002,503,003,504,00
0 100 200 300 400 500 600 700
ln(Y) xModèle3:ln(Y)vsx
0,000,501,001,502,002,503,003,504,00
2,00 2,50 3,00 3,50 4,00 4,50 5,00 5,50 6,00 6,50 7,00
ln(Y) ln(x)Modèle4:ln(Y)vsln(x)b)
Appellation dans Excel Symbole FormuleCoeff. de determination multiplercoe. de correlation echantillonnal
Cov(X;Y)S
XSY=SXYpS
XXSY YCoeff. de determination R^ 2R21SSESST
=SSRSST =r2Coeff. de determination R^ 2R2ajuste1SSE=(n2)SST=(n1)= 1MSES 2y4Universite Laval
Faculte des sciences et de genie
Departement de mathematiques et de statistiqueSTT-2902Automne 2012
Emmanuelle Reny-Nolinc)
Modele 1 : Y en fonction de XR2= 0:3275
Modele 2 : Y en fonction de ln(X)R2= 0:3925
Modele 3 : ln(Y) en fonction de XR2= 0:3535
Modele 4 : ln(Y) en fonction de ln(X)R2= 0:5883Le modele 4 est encore privilegie, car c'est celui pour lequel la proportion de variabilite
expliquee par le modele est la plus grande. d)2=MSE= 0:2000 e) mo yennedes r esidus= 3:4710160 et ecart-type des residus = 0:4413. On aurait pu trouver ces valeurs sans utiliser la liste des residus, car la moyenne des ecarts est toujours 0, et la variance echantillonnale des residus correspond a une petite transformation duMSE, soit s 2"=n P i=1(^"i")2(n1)=n P i=1([yi^yi]0)2(n1)=(n2)MSE(n1)Exercice 4 - Jouons avec les Y
a) i)M ethodede Ma yer:
Deux points moyens :P1= (19;5;3;0) etP2= (44;17;8;3)Equation de la droite :^Y1= 0;2162x1;2329
ii)M ethodem ediane-mediane:
Trois points medians :P1= (14;5;2;1),P2= (32;5;1) etP3= (50;5;9;4)Moyenne des points medians : (32;33;5;50)
Equation de la droite :^Y1= 0;2028x1;0565
b) La p entec hangerade signe, mais aura la m ^emev aleurabsolue. P ourl'ordonn ee s l'origine, les calculs sont necessaires : i) Equation de la droite de Mayer :^Y2=0;2162x+ 12;5329 ii) Equation de la droite mediane-mediane :^Y2=0;2028x+ 12;0565 c) Non, les v aleursde Ysont liees aux valeurs deX. On ne peut pas separer les valeurs d'un m^eme individu. On ordonne selonXet lesYsuivent.5Universite Laval
Faculte des sciences et de genie
Departement de mathematiques et de statistiqueSTT-2902Automne 2012
Emmanuelle Reny-NolinExercice 5 - Un air de deja vu... a) On sait que la droite de r egressionpasse par ( x;y) = (0;6;4;15). On donne un autre point dans la question, soit (0;^0) = (0;2;335):On peut donc evaluer la pente de la droite : ^1=yx=4;152;3350;60= 3;025L'equation de la droite de regression :
^Y=^0+^1x= 2;335 + 3;025x b)SXX= (n1)s2X= 90;0889 = 0;8001 SY Y= (n1)s2Y= 90;8206 = 7;388
MSE=SSE=(n2) = 0;0645=8 = 0;00806
Erreur-type(
^0) :sMSE 1n +x 2S XX =s0;00806110 +0;620;8001 = 0;0666Erreur-type(
^1) :rMSE SXX=r0;008060;8001= 0;1004
c) Il y a deux fa consde r epondre acette question. Il s'agit d'un test unilat erals ur1: H0:1= 3
H 1:1>31) Test d'hypothese sur la pente :On construit une statistique de Student en se basant sur le fait que
^1N 1;2S XXSiH0est vraie, alorsT0=^13err:type(^1)=^13pMSE=S
XXtn2.
Puisquetobs=3:02530;1004= 0:249 n'est pas superieure a la valeur critiquet;n2= t0:05;8= 1;86, on ne rejette pasH0.
2) Intervalle de conance sur la pente :Un intervalle de conance de niveau 1estequivalent a un testbilateralde seuilsur
un parametre, car il a deux bornes. La zone de rejet du test unilateral (H1:1>3)6Universite Laval
Faculte des sciences et de genie
Departement de mathematiques et de statistiqueSTT-2902Automne 2012
Emmanuelle Reny-Nolinexclut les 5% des valeurs les plus improbables de la distribution de ^1sousH0a l'extremitedroitedu spectre. L'intervalle de conance correspondant devra "exclure"5% des valeurs a chaque extremite du spectre. Il aura donc un niveau de 90%.
1t8;0;05err:type(^1) = 3;0251;860;1004 = [2;838;3;212]
On rejetteraitH0si toutes les valeurs de l'intervalle de conance etaient superieures a 3. C'est donc la borne inferieure qui determine notre decision. On ne peut donc pas conclure que la pente de la droite est superieure a 3 au seuil= 5%. d)R2=SSRSST = 1SSESST = 1SSESY Y= 10;06457;388= 0;9913:
e) In tervallede pr edictionp ourune observ ationfuture : ^y0t8;0;025rMSE 1 + 1n +(x0x)2S XX2;335 + 3;025(0;9)2:306r0:00806
1 + 110+(0;90;6)20;8001
5;0580;228
[4;830;5;286] f) i) Si on a vaitc hoisiune quan tited'a ntibiotique egale a0,7, l'in tervalleaurait ete plus court carx0aurait ete plus proche de la moyenne. ii) Si on a vaitc hoisi= 0:01, l'intervalle aurait ete plus long, car le quantilet8;0;005 aurait ete plus grand. iii) S ion a vaitutilis eune taille d' echantillonde 20 unit es,l'in tervalleaurait eteplus court, carnetSXXseraient plus grands ettn2;0;025serait plus petit. iv) S ion a vaitconstruit l'in tervallep ourestimer la densit eoptique mo yennede tous les tubes ayant recu une quantite d'antibiotique egale a 0,9, l'intervalle aurait ete plus court, car on aurait choisi la formule de l'intervalle de conance pour E(Yjx0), qui tient seulement compte de l'erreur d'estimation du point sur la droite. g) i) Ce tub ea re cux1;5sX= 0;61;5(0;298) = 0;153 unite d'antibiotique. ii) densit eoptique pr edite= 2,797 iii) C ettev aleurse situe a1,493 ecart-typede la densit eoptique mo yenne iv)1 ;5r= 1;493!r= 0;995. On peut verier qu'il s'agit de la racine carree
positive deR2.7Universite Laval
Faculte des sciences et de genie
Departement de mathematiques et de statistiqueSTT-2902Automne 2012
Emmanuelle Reny-Nolinh)
i) La mo yennedes xiet desyirestera exactement la m^eme dans les deux cas. ii) L' equationde la droite de r egressionrestera inc hangee. On peut voir facilement queSxxsera deux fois plus petit, car chaque ecart est present une seule fois dans la somme au lieu de deux. S xysera aussi deux fois plus petit. Pour s'en convaincre, prenons les deux premiers termes de la somme avant reduction des donnees : (0:2x)(2:9y) + (0:2x)(3:0y) = (0:2x)(2:9 + 3:02y) Ils sont maintenant remplaces par (0:2x)(2:95y) dans la somme apres reduction des donnees. Idem pour les huit autres termes deSxy. iii) L' estimationde la v ariancea utourde la droite sera consid erablementr eduiteet par consequent la marge d'erreur sur les predictions sera faussement diminuee. Une bonne partie de la variabilite naturelle dans les observations est occultee par la mise en commun desYayant la m^eme valeur deX.Exercice 6 - Ma cabane au Canada
Cov(X;Y) = 374225
r(X;Y) = 0;77 a) O nd ecided'exprimer le prix des maisons en milliers de dollars plut^ otqu'en dollars.PosonsW=Y=1000.
Cov(X;W) =Cov
X;Y1000
=11000Cov(X;Y) = 374;225
r(X;W) =Cov(X;W)pV ar(X)V ar(W)=Cov(X;Y=1000)pV ar(X)V ar(Y=1000)=1=1000Cov(X;Y)pV ar(X) (1=1000)2V ar(Y)