[PDF] Le modèle linéaire Modélisation dune variable quantitative en





Previous PDF Next PDF



Bases du Mod`ele Linéaire

En regression multiple le dispositif est orthogonal si les variables explicatives sont non corrélées entre elles. Dans ce cas les colonnes de la matrice X 



Le Modèle Linéaire et ses Extensions

14 sept. 2016 Il suppose connues les notions de base de l'inférence statistique estimateur



Utilisation du modèle linéaire. Rappels de base - méthodes de

4 nov. 2000 UTILISATION DU MODELE LINEAIRE. RAPPELS DE BASE - METHODES DE VALIDATION. Philippe GROS *. Centre de Brest. Pages.



Comparaison entre lanalyse logit et probit et les réseaux de

de donnés: un outil statistique le mod`ele logit ou probit



Commande prédictive à base de modèle (MPC) pour le trafic urbain

28 mar. 2017 Mots-clés—Commande prédictive à base de modèle MPC



Le modèle linéaire Modélisation dune variable quantitative en

20 dec. 2021 Choix d'un mod`ele. Régression et ANOVA. Objectifs pédagogiques. Connaˆ?tre les bases théoriques du mod`ele linéaire.



Construction des modèles radiobiologiques de type TCP (tumor

Le modèle linéaire-quadratique (LQ) est le modèle le plus souvent utilisé depuis les Le modèle est basé sur une réponse impulsionnelle à la dose (en.



Evaluation a priori dun modèle non-linéaire de turbulence

Le modèle algébrique explicite non-linéaire récemment mis au point par Rumsey C.L. The data base used here comes from a direct numerical simulation of a.



Réseaux de neurones : modèle linéaire généralisé

Bases fonctionnelles. 4. Problème des grandes dimensions. 5. Régularisation. 6. Discrimination. Réseaux de neurones – Le mod`ele linéaire généralisé – p.2/ 



Le Mod`ele Linéaire Gaussien Général

Le mod`ele linéaire (gaussien) de base. `A la fois le plus simple le plus ancien et le plus connu des mod`eles statistiques

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVALe mod`ele lin´eaire

Mod´elisation d'une variable quantitative en

fonction de variables quantitatives ou qualitatives

M. L. Delignette-Muller

VetAgro Sup

5 janvier 2023

M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAIllustration

Ex. : mod´elisation d'une variable quantitative (le poids 10 jours ap. traitement) en fonction de deux variables explicatives, une quantitative (le poids initial) et une qualitative (le traitement).

M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAObjectifs p´edagogiques

Connaˆıtre les bases th´eoriques du mod`ele lin´eaire. Connaˆıtre le cadre d'utilisation classique du mod`ele lin´eaire. Savoir v´eriifier ses conditions d'utilisation. Savoir interpr´eter les coeiÌifiÌicients estim´es et utiliser un mod`ele en inf´erence.Avoir un aper¸cu des extensions du mod`ele lin´eaire.

M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAPlan

1La r´egression lin´eaire multipleMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erence

2Choix d'un mod`eleComparaison de mod`eles et s´election de variables

Mod`eles polynomiaux

Transformation de variables

3R´egression et ANOVAMod`ele d'ANOVA1

Mod`eles d'ANOVA 2

Mod`eles d'ANCOVA

M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceExemple inspir´e de la litt´erature

Hanet al.2001,

Response Surface Modeling for the Inactivation ofEscherichia coli O157 :H7 on Green Peppers (Capsicum annuumL.) by Chlorine

Dioxide Gas Treatments.4 variables contrˆol´ees:concentration en dioxyde de chloreCl02(mg.l-1),temp´eratureT(◦C),temps de traitementt(min) ethumidit´e relativeHR(%).Variable observ´ee not´eeLR: la r´eduction bact´erienne en

UFC (en log) pour 5 g de poivre.

M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceVisualisation du jeu de donn´ees

> d <- read.table("DATA/han2001.txt", header = TRUE, stringsAsFactors = TRUE) > str(d) ?data.frame?: 29 obs. of 5 variables: $ T : int 10 20 10 20 10 20 10 20 10 20 ... $ HR : int 65 65 85 85 65 65 85 85 65 65 ... $ ClO2: num 0.2 0.2 0.2 0.2 0.4 0.4 0.4 0.4 0.2 0.2 ... $ t : num 15 15 15 15 15 15 15 15 65 65 ... $ LR : num 1.59 1.71 2.19 2.25 3.7 3.98 4.88 5 2.03 2.71 ... > head(d)

T HR ClO2 t LR

1 10 65 0.2 15 1.59

2 20 65 0.2 15 1.71

3 10 85 0.2 15 2.19

4 20 85 0.2 15 2.25

5 10 65 0.4 15 3.70

6 20 65 0.4 15 3.98

M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceImpact du dioxyde de chlore?

Diagramme de dispersion et r´egression simple en ignorant les autres variables de contrˆole0.10.20.30.40.5 1 2 3 4 5 ClO2 LR r 2 = 0.70M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceImpact de la temp´erature?

Diagramme de dispersion en ignorant les autres variables de contrˆole510152025 1 2 3 4 5 T

LRM.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceImpact du temps de traitement?

Diagramme de dispersion en ignorant les autres variables de contrˆole20406080100120140 1 2 3 4 5 t

LRM.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceImpact de l'humidit´e relative?

Diagramme de dispersion en ignorant les autres variables de contrˆole60708090 1 2 3 4 5 HR

LRM.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erencePrise en compte de plusieurs variables de contrˆole

L'efffet le plus ´evident est celui du dioxyde de chlore, maisles autres variables n'ont-elles pas d'efffet?

Serait-il int´eressant de les int´egrer dans un mod`ele pour mieux pr´edire l'efffet d'un traitement?Ne pourrait-on pas atteindre un pourcentage de variance expliqu´ee (r2) sup´erieur `a 70%? ⇒int´erˆet de lar´egression multiple.M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceLe mod`ele de r´egression multiple Simple extension du mod`ele de r´egression lin´eaire simple permettant la prise en compte de plusieurs variables de contrˆole (appel´ees aussi r´egresseurs ou covariables). Y avecϵi∼N(0,σ)

Partie d´eterministe : relation lin´eaire

Partie stochastique : mod`ele gaussien

ial´eatoires, ind´ependants, suivant une loi normale

(loi de Gauss) de variance r´esiduelleσ2constante.M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceM´ethode d'estimation des param`etres

Comme en r´egression lin´eaire simple.

Maximisation de la vraisemblance(maximisation de

Pr(Y|β0,β1,...,βp,σ)) qui revient dans le cadre du mod`ele gaussien `a laminimisation de la Somme des Carr´es des Ecarts (SCE)

SCE=Pn

i=1e2iavecei=Yi-ˆYi Probl`eme d'optimisation auquel correspond une solution analytique :b= (X′X)-1X′y avecb= b 1 b 2 b ,X= 1x11...xp1

1x12...xp2

ety= y 1 y 2 y M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceR´egression lin´eaire multiple avecR > m <- lm(LR ~ T + HR + ClO2 + t, data = d) > m Call: lm(formula = LR ~ T + HR + ClO2 + t, data = d)

Coefficients:

(Intercept) T HR ClO2 t -4.3783 0.0258 0.0435 11.5208 0.0177

M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceR´egression lin´eaire multiple avecR > summary(m) Call: lm(formula = LR ~ T + HR + ClO2 + t, data = d)

Residuals:

Min 1Q Median 3Q Max

-0.8313 -0.0872 0.0269 0.1215 0.4323

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -4.37830 0.48624 -9.00 3.7e-09

T 0.02575 0.01110 2.32 0.029

HR 0.04346 0.00555 7.83 4.6e-08

ClO2 11.52083 0.55483 20.76 < 2e-16

t 0.01775 0.00188 9.45 1.5e-09 Residual standard error: 0.272 on 24 degrees of freedom Multiple R-squared: 0.961, Adjusted R-squared: 0.954

F-statistic: 147 on 4 and 24 DF, p-value: <2e-16

M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceComparaison pr´edits / observ´es pour les 2 mod`eles12345 1 2 3 4 5

LR observé

LR prédit

Modèle à un régresseur (ClO2)

12345
1 2 3 4 5

LR observé

LR prédit

Modèle à 4 régresseursM.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceInt´erˆet de la prise en compte de plusieurs r´egresseurs Dans cet exemplechaque r´egresseur apporte une contribution signiificative `a

l'explication de la variable observ´ee.On passe de 70% de variance expliqu´ee (r2) avec seulement

ClO

2`a 96% avec les 4 r´egresseurs.

Mais le mod`ele th´eorique est-il valable, tant pour sa partie d´eterministe que pour sa partie stochastique?

⇒V´eriificationa posteriorides conditions d'utilisation.M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceExamen des r´esidus

Mˆeme principe qu'en r´egression lin´eaire simple : v´eriificationa posterioridu mod`ele d'erreur gaussien (partie stochastique du mod`ele).graphe des r´esidus= examen des r´esidus en fonction de la variable pr´editediagramme Quantile-Quantiledes r´esidus (v´eriification de la normalit´e de leur distribution)+ examen desr´esidus en fonction de chaque r´egresseur (notamment pour contrˆoler la lin´earit´e du mod`ele)

M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceGraphe des r´esidus

> plot(residuals(m) ~ fitted(m), pch = 16)12345 -0.8 -0.4 0.0 0.2 0.4 fitted(m) residuals(m)M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceDiagramme Quantile - Quantile des r´esidus > qqnorm(residuals(m), pch = 16) > qqline(residuals(m), lty = 3)-2-1012 -0.8 -0.4 0.0 0.2 0.4

Normal Q-Q Plot

Theoretical Quantiles

Sample QuantilesM.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceR´esidus en fonction de chaque r´egresseur (1) > plot(residuals(m) ~ T, data = d, pch = 16, col = "blue")510152025 -0.8 -0.4 0.0 0.2 0.4 T residuals(m)M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceR´esidus en fonction de chaque r´egresseur (2) > plot(residuals(m) ~ HR, data = d, pch = 16, col = "orange")60708090 -0.8 -0.4 0.0 0.2 0.4 HR residuals(m)M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceR´esidus en fonction de chaque r´egresseur (3) > plot(residuals(m) ~ ClO2, data = d, pch = 16, col ="green")0.10.20.30.40.5 -0.8 -0.4 0.0 0.2 0.4 ClO2 residuals(m)M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceR´esidus en fonction de chaque r´egresseur (4) > plot(residuals(m) ~ t, data = d, pch = 16, col = "red")20406080100120140 -0.8 -0.4 0.0 0.2 0.4 t residuals(m)M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceD´etection des donn´ees inlfluentes -"Jacknife"ou eustachage

Pour chaque observationn◦i(iallant de 1 `an)r´eestimation des param`etres du mod`ele par r´egression sur le

jeu de donn´ees sans l'observationn◦iquantiification globale de l'impact de l'observationn◦isur

l'ensemble des param`etres du mod`ele -distance de Cook Graphe repr´esentant les distances de Cook en fonction du num´ero de l'observation, permettant de d´etecter d'´eventuelles observations nettement plus inlfluentes que les autres.

M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceGraphe des distances de Cook

> plot(m, which = 4)051015202530 0.00 0.05 0.10 0.15 0.20

Obs. number

Cook's distance

lm(LR ~ T + HR + ClO2 + t)

Cook's distance

19 23

7M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceRep´erage possible aussi des observations extrˆemes sur le graphe des r´esidus et le diagramme Quantile- Quantile > plot(m, which = 1); plot(m, which = 2)12345 -0.5 0.0 0.5

Fitted values

Residuals

Residuals vs Fitted

23
19 7 -2-1012 -3 -2 -1 0 1 2

Theoretical Quantiles

Standardized residuals

Normal Q-Q

23
19

7M.L. Delignette-MullerLe mod`ele lin´eaire

La r´egression lin´eaire multiple

Choix d'un mod`ele

R´egression et ANOVAMod`ele et estimation des param`etres

Conditions d'utilisation

Inf´erenceQue faire en cas de non respect du mod`ele d'erreur? Non normalit´e des r´esidus et/ou h´et´eroscedasticit´e (variance non constante) : tenter une transformation de variable ou changer la partie stochastique du mod`ele (mod`ele g´en´eralis´e)Non ind´ependance des r´esidusou non lin´earit´e : tenter unequotesdbs_dbs25.pdfusesText_31
[PDF] Bases du Web Design

[PDF] BASES D`EXERCICES EN LIGNE À L`UNIVERSITÉ BASES D

[PDF] Bases d`hydraulique - Anciens Et Réunions

[PDF] bases ecologiques , interet epidemiologique - France

[PDF] Bases et Diagnostic

[PDF] Bases et Méthodes de la Chimie Quantique

[PDF] Bases informatiques - Ordinateur

[PDF] Bases Java - Eclipse / Netbeans Environnements Java 1 - Espèces En Voie De Disparition

[PDF] Bases juridiques pour le quotidien du médecin - Santé Et Remise En Forme

[PDF] BASES LEGALES DU JEU CONCOURS « WHAT TRAVEL MOVIE - France

[PDF] Bases légales pertinentes : l`art. 50 LEtr et l`art. 77 al. 6 OASA

[PDF] Bases moléculaires de la maladie de Parkinson

[PDF] bases moléculaires des pathologies - Désordre Mental

[PDF] bases nautiques de Calais Côte d`Opale

[PDF] Bases neurobiologiques de la récompense - Avantages Et Compensation