[PDF] GLM : Generalized Linear Models





Previous PDF Next PDF



The binomTools package: Performing model diagnostics on

18 авг. 2011 г. Fit model in R. > beetles.glm <- glm(cbind(y n-y) ~ type + log(dose)



glm — Generalized linear models

glm r ldose family(binomial n) link(logit) . glm r ldose



dispmod: Modelling Dispersion in GLM

17 мар. 2018 г. Depends R (>= 3.0) stats. Suggests car (>= 2.1). License GPL (>= 2 ... lm



Stepwise Logistic Regression with R

Stepwise Logistic Regression with R. Akaike information criterion: AIC = 2k glm(formula = low ~ 1 family = binomial). Deviance Residuals: Min 1Q Median ...



glm — Generalized linear models

glm r ldose family(binomial n) link(logit) . glm r ldose



Regression Models for Count Data in R

Keywords: GLM Poisson model



Visualizing GLMs for binary outcomes

7 дек. 2015 г. females) using stat smooth(method="glm"



pglm: Panel Generalized Linear Models

R ISBN:978-1-118-94918-4. License GPL (>= 2). URL https://cran.r ... Estimation by maximum likelihood of glm (binomial and Poisson) and 'glm-like' models (Negbin.



Generalized linear models in R Regression models Generalized

To fit a glm R must know the distribution and link function. Fit a Three ways to fit binomial glms in R; here are two: 1 td.glm <- glm( prop ~ Hours ...





Le modèle linéaire généralisé avec R : fonction glm()

Sous R : lm(variable à expliquer ~ variable(s) explicative(s) ) ... glm(formula = y ~ ldose



Le Modèle linéaire généralisé (glm)

2 mar. 2015 modèle logistique avec le logiciel R. Nous presentons plusieurs exemples. ... CHD.logit = glm(CHD~AGE family=binomial(link="logit")).



GLM : Generalized Linear Models

R : lm() - SAS : PROC GLM. Generalized Linear Model y = variable continue ou de comptage ou binaire ou % Résidus : distribution Normale ou Poisson ou ...



glm — Generalized linear models

4. Family negative binomial log-link models—also known as negative binomial regression models—are used for data with an overdispersed Poisson distribution.



5-Modèle linéaire généralisé

Call: glm(formula = y1 ~ x family = binomial). Coefficients: (Intercept) x. -6.557. 0.135. Degrees of Freedom: 99 Total (i.e. Null); 98 Residual.



TP ozone : Modèle linéaire gaussien binomial

https://www.math.univ-toulouse.fr/~besse/Wikistat/pdf/tp_ozone1_ancova_logit.pdf



GLM : Generalized Linear Models

R : lm() - SAS : PROC GLM. Generalized Linear Model y = variable continue ou de comptage ou binaire ou % Résidus : distribution Normale ou Poisson ou ...



Régression logistique avec R

Le statisticien responsable de l'étude réalise un modèle logistique. Les sorties sur R sont : Call: glm(formula = Y ~ X family = binomial). Coefficients:.



23. Binomial ANOVA

To indicate that you have a binomial response we must tell R the family of the model. Have a look at the AIC. lr.model = glm(Pine_PA~MAT+MAP 



Visualizing GLMs for binary outcomes

7 déc. 2015 We load it into the R session using1 data(Titanicp package="vcdExtra") ... females)



Generalized Linear Models in R - Stanford University

glm( numAcc˜roadType+weekDay family=poisson(link=log) data=roadData) ?ts a model Y i ? Poisson(µ i) where log(µ i) = X i? Omitting the linkargument and setting family=poisson we get the same answer because the log link is the canonical link for the Poisson family Other families available include gaussian binomial inverse



Module 5: Generalized Linear Models in R - pagesvassaredu

distributions glm() for the Poisson distribution and a special version of the glm() function that is just for the negative binomial glm nb() which is found in the MASS package (so make sure to load the package rst) Since the function speci es that it is for a negative binomial you do not need to specify



GLM in R Learn How to Construct Generalized Linear Model

use glm() directly to ?t logistic-binomial probit and Poisson regressions among othersandtocorrectforoverdispersionwhereappropriate Orderedlogitandprobit regressions can be ?t using the polr() function unordered probit models can be ?t using the mnp package and t models can be ?t using the hett package in R (See



Regression Models for Count Data in R

The classical Poisson geometric and negativebinomial models are described in a generalized linear model (GLM) framework; they areimplemented inRby theglm()function (Chambers and Hastie1992) in thestatspackageand the glm nb()function in theMASSpackage (Venables and Ripley2002)



MGLM: An R Package for Multivariate Categorical Data Analysis

broaden the class of generalized linear models (GLM) for analysis of multivariate categorical data MGLM overlaps little with existing packages in R and other softwares The standard multinomial-logit model is implemented in several R packages (Venables and Ripley2002) with VGAM (Yee2010 20152017) being the most comprehensive



When to use GLM?

    GLM in R is a class of regression models that supports non-normal distributions and can be implemented in R through glm() function that takes various parameters, and allowing user to apply various regression models like logistic, poission etc., and that the model works well with a variable which depicts a non-constant variance, with three ...

What is an example of a linear binomial?

    To factor a number means to write it as a product of its factors. For example: 2x + 1; 9y + 43; 34p + 17q are linear binomials. To factor a linear binomial means to write it as a product of its factors. The HCF is factored out and the sum/difference of remaining factors is written in a pair of parentheses.

What is the binomial distribution equation?

    The formula for the binomial probability distribution is as stated below: Binomial Distribution Formula. Binomial Distribution. P (x) = n C r · p r (1 ? p) n?r. Or, P (x) = [n!/r! (n?r)!] · p r (1 ? p) n?r. Where, n = Total number of events. r = Total number of successful events.

GLM : Generalized Linear Models

G. San Martin

gilles.sanmartin@gmail.com

Centre Wallon de Recherche Agronomique

2Quelques livresQuelques livresQuelques livresQuelques livres

Formation principalement basée sur 4 livres.

Tous ont une approche unifiée "moderne" (GLM) et certains font le lien avec les stats classiques

Gelman & Hill

Le plus détaillé

tout en restant très accessibleFox

Le plus simple

aborde des problèmes rarement abordésZuur et al.

Le plus appliqué.

Pour être opérationnel

le plus vite possibleKery

Analyse classique

et Bayésienne de

Jeux de données

simulés

3ObjectifsObjectifsObjectifsObjectifs

Qu'est-ce qu'un GLM, à quoi çà sert ?

Illustrer :

Exemples des principaux types de GLM

La plupart des tests statistiques classiques sont des cas particuliers de GLM

Insister sur :

Comment interpréter les sorties du logiciel ?

Comment en faire une représentation graphique ? Quelles sont les conditions d'application, comment les vérifier et comment solutionner les problèmes ?

4GLMs : qu'est-ce que c'est ?GLMs : qu'est-ce que c'est ?GLMs : qu'est-ce que c'est ?GLMs : qu'est-ce que c'est ?

Régression établissant le lien entre une variable à expliquer/prédire et une ou plusieurs variables descriptives/explicativesy=α+β1∗x1+β2∗x2+...+ϵVariable "dépendante" a expliquer : données continues binaires comptage %Variables "explicatives"

Quantitatives

Qualitatives

InteractionsRésidus = Erreur

parties de la variabilité que l'on ne peut pas expliquer avec ces variablesParamètres à estimerRelation linéaire additive

Distrib Normale

Distrib de Poisson

Distrib Binomiale

etc...

5GLMs : qu'est-ce que c'est ?GLMs : qu'est-ce que c'est ?GLMs : qu'est-ce que c'est ?GLMs : qu'est-ce que c'est ?

(General) Linear Model y = variable continue à distribution à peu près normale

Résidus : distribution Normale

Méthode d'estimation = Sum of Squares

R : lm() - SAS : PROC GLM

Generalized Linear Model

y = variable continue ou de comptage ou binaire ou %,... Résidus : distribution Normale ou Poisson ou Binomiale,...

Fonction de lien

Méthode d'estimation = Maximum Likelihood

R : glm() - SAS : PROC GENMOD

6ProgrammeProgrammeProgrammeProgramme

Part 1 : (General) Linear Model (LM)

On va s'intéresser principalement aux variables explicatives Y sera toujours une variable quantitative continue approximativement normale

1 X quantitatif = régression linéaire simple

1 X qualitatif à 2 niveaux = test de student

1 X qualitatif à n niveaux = ANOVA

Comparaisons multiples

Plusieurs X quantitatifs = régression multiple

Plusieurs X quantitatifs ou qualitatifs = ANCOVA

Interactions

Relations non linéaires

7ProgrammeProgrammeProgrammeProgramme

Part 2 : Generalized Linear Model (GLM)

La partie concernant les variables explicatives (x) change peu.

2 changements : distributions des résidus - fonctions de lien

On choisi la distribution des résidus a priori sur base du type de données. On vérifiera ensuite sur base des résultats si cette première idée est bonne ou pas ...

Y = données de comptage

Tables de contingence

--> distribution de Poisson

Y binaire ou % (nbre de succès/nbre d'essais)

--> distribution binomiale

Autres données continues (y compris autres %)

--> distribution gaussienne

8Part 1 : General Linear ModelPart 1 : General Linear ModelPart 1 : General Linear ModelPart 1 : General Linear Model

9Régression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatif

Il s'agit ici de trouver la meilleure droite passant par un nuage de points Exemple : relation entre les doses de fertilisants et la production de tomates

Concepts à assimiler :

Pente, intercept, résidus

Interprétation géométrique des paramètres

R², % de variance expliquée

Valeurs prédites

10Régression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatif

Représentation algébrique du modèle : yi=α+β∗xi+ϵiVariable dépendante observéeVariable explicative observée "intercept""pente""résidus"

Intercept :

valeur prédite de y quand x = 0

Pente (= "Slope") :

de combien augmente y quand x augmente de une unité ?

Résidus :

différence entre les valeurs observées et les valeurs prédites

11Régression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatif

Représentation géométrique du modèle :

Intercept

= αPente = βDroite = ŷ

Valeurs prédites

par le modèle

Points = y

valeurs observées distance droite - points = Résidus = ε X = dose fertilisantY = poids des tomates La droite optimale est celle qui minimise les résidus (ie la somme des carrés des résidus)yi=α+β∗xi+ϵi

12Régression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatif

Représentation algébrique du modèle : ϵ∼Normale(0,σ2)

ϵi=yi-̂yi

̂yi=α+β∗xi"Valeurs prédites par le modèle" Les résidus sont la différence entre les valeurs observées et les valeurs prédites Les résidus suivent une distribution Normale de moyenne 0 et de variance sigma²

3 paramètres doivent être estimés : l'intercept, la pente

et la variance des résidus

13Exemple : production tomates ~ dose fertilisantOn génère des données (n=100) pour avoir un intercept (alpha) de 10 kg, une

pente (beta) de 0.75 kg et une variance des résidus (sigmasq) de 16 kg². On a 5 doses de fertilisant (0-4) et 20 observations par dose. > alpha <- 10 > beta <- 0.75 > sigmasq <- 16 > n <- 100 > x <- rep(0:4, each = n/5) > set.seed(1) > y <- alpha + beta * x + rnorm(n = n, mean = 0, sd = sqrt(sigmasq)) > # autre manière de faire strictement identique : > set.seed(1) > y <- rnorm(n = n, mean = (alpha + beta * x) ,

sd = sqrt(sigmasq))Régression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatif

14> mod <- lm(y ~ x)

> summary(mod) Call: lm(formula = y ~ x)

Residuals:

Min 1Q Median 3Q Max

-9.3209 -2.4158 0.0329 2.3406 9.1842

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 10.4621 0.6254 16.727 < 2e-16 *** x 0.7367 0.2553 2.885 0.00481 ** Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.611 on 98 degrees of freedom Multiple R-squared: 0.0783,Adjusted R-squared: 0.0689

F-statistic: 8.325 on 1 and 98 DF, p-value: 0.004808Régression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatif

Estimation du modèle

Résumé du modèle

Intercept (alpha) estimé

Pente (beta) estimée

erreur standard des résidus

15> mod <- lm(y ~ x)

> summary(mod)

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 10.4621 0.6254 16.727 < 2e-16 *** x 0.7367 0.2553 2.885 0.00481 ** Residual standard error: 3.611 on 98 degrees of freedom Multiple R-squared: 0.0783,Adjusted R-squared: 0.0689

F-statistic: 8.325 on 1 and 98 DF, p-value: 0.004808Régression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatifRégression linéaire simple : 1 x quantitatif

Interprétation

Quand on ne met aucun fertilisant (x=0) on estime que la production moyenne de tomates est de 10.4621 kg Quand la dose de fertilisant augmente d'une unité, la production de tomates augmente de 0.7367 kg (dans la limite des doses testées) On peut prédire la production de tomate en fonction de la dose de fertilisant. Par exemple on estime que pour une dose de 1.42 unités de fertilisant, on aura en moyenne une production de 10.4621 + 0.7367 * 1.42 = 11.51 kg de tomates Autour de ces valeurs prédites, les résidus ont un écart-type estimé (erreur standard) de 3.611 kg Attention il ne s'agit PAS de l'erreur standard des valeurs prédites !

16> summary(mod)

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 10.4621 0.6254 16.727 < 2e-16 ***quotesdbs_dbs5.pdfusesText_10
[PDF] glm courbe roc

[PDF] global compact 10 principles

[PDF] global compact entreprises signataires

[PDF] global compact france

[PDF] global compact onu

[PDF] global compact participants

[PDF] global e commerce sales

[PDF] global e commerce sales

[PDF] global management definition

[PDF] global minimum variance portfolio

[PDF] global reporting initiative

[PDF] global strategy company example

[PDF] global supply chain management

[PDF] global warming anglais seconde

[PDF] global warming sequence