[PDF] [PDF] Chapitre 9 Analyse de la variance

“variance totale = variance intra + variance inter”, la variance intra, moyenne des variances (conditionnelles), quantifie la part de la variabilité intrins`eque de Y 



Previous PDF Next PDF





[PDF] Chapitre 9 Analyse de la variance

“variance totale = variance intra + variance inter”, la variance intra, moyenne des variances (conditionnelles), quantifie la part de la variabilité intrins`eque de Y 



[PDF] Cours 11 Une variable numérique : dispersion et variance Variance

variance comme indice de dispersion, mesure de l'éparpillement des intra + variance inter , ou encore variance totale = moyenne des variances + variance 



[PDF] TD Statistique : Chapitre 8

Total 82 92 178 217 166 84 19 838 1 Calculer les 3 variances et les écart- types correspondants Calcul de la variance intra + variance inter Moyenne 



[PDF] TD1 : Moyenne et Variance

5) Calculer la variance des salaires dans l'usine A puis dans l'usine B 1) la variance totale σ2, 2) la variance intra-groupe σ2 intra, 3) la variance inter- groupe σ2 inter Chaque variance doit être calculée directement à partir de sa définition



[PDF] Chapitre 7

L'analyse de la variance (ANOVA) a pour objectif d'étudier l'influence d'un ou différents groupes : écart des moyennes des groupes à la moyenne totale) à variabilité à l'intérieur des classes, d'où le nom de variance intra-classes (intra-



[PDF] Cours 8 : Analyse de variance à un facteur - uOttawa

Pour des raisons de généralisation, le chercheur a tout intérêt à tester additive (variance totale ≠ variance intra groupe + variance intergroupe) Par contre, 



[PDF] Statistique descriptive - Nathalie Vialaneix

12 jan 2011 · Calculer la variance inter-groupes, la variance intra-groupes puis la variance totale de la note de goût pour les bières des deux pays Réponse 



[PDF] Analyse de la Variance

On utilisera ici la mesure de variance afin de déterminer le caractère significatif, ou non, des Variabilité totale = var due au facteur étudié + var naturelle (ou intrinsèque) que celle entre observations à l'intérieur de chacun des groupes ??



[PDF] ANALYSE DE LA VARIANCE Plan : - cloudfrontnet

L'analyse de variance a pour objectif d'expliquer les variations d'une variable mesurée au La variation totale, c'est-à-dire la somme des carrés des écarts entre toutes résiduelle, en revanche, est mesurée à l'intérieur de chaque groupe et tend G La variance intra-groupe (la somme moyenne des écarts carrés entre 

[PDF] Brochure pratique 2016 - Phase test - Impotsgouvfr

[PDF] TABLEAU DE DETERMINATION DU RESULTAT FISCAL

[PDF] Guide méthodologique à usage des entreprises - Etablissement

[PDF] 26 chaabane 1437 - Portail Marocain des Marchés Publics

[PDF] Guide méthodologique à usage des entreprises - Etablissement

[PDF] Guide méthodologique à usage des entreprises - Etablissement

[PDF] Informations sur le décompte de traitement Madame - EPFL

[PDF] Déconcentration et décentralisation

[PDF] Dissertation TD n°3 Sujet : La décentralisation - cloudfrontnet

[PDF] Dissertation TD n°3 Sujet : La décentralisation - cloudfrontnet

[PDF] Déconcentration et décentralisation

[PDF] Architecture intérieure / Design

[PDF] harmonie des couleurs et finitions - Kinnarps

[PDF] LES PROVINCES ETE LES CHEFS LIEUX

[PDF] Chapitre 2 : Organisation institutionnelle administrative et judiciaire

[PDF] Chapitre 9 Analyse de la variance

Chapitre 9. Analyse de la variance

Dans ce chapitre nous

´etudions comment l"analyse de la variance deY

permet de tester l" ´egalit´e des moyennes conditionnelles de cette variable num ´erique dans les sous-populations induites parX. Dans cette probl ´ematique,Xest appel´ee lavariable explicative, ou le facteur explicatif, etYlavariable expliqu´ee.

Dans la formule de la d

´ecomposition de la variance,

“variance totale = variance intra + variance inter", la variance intra, moyenne des variances (conditionnelles), quantifie la part de la variabilit ´e intrins`eque deY, et la variance inter, variance des moyennes (conditionnelles), mesure l"h ´et´erog´en´eit´e des sous-populations. 1

1) Variance expliqu

´ee

D

´efinition:La

variance expliqu

´ee par la variableX

est

´egale`a la

variance inter divis

´ee par la variance globale deY

C"est un nombre compris entre0et1puisque les variances sont des nombres positifs ou nuls, et que la variance inter est une part de la variance globale.

La variance expliqu

´ee est une mesure du lien entre le facteurXet la mesure num ´eriqueY, pour appr´ecier commentYd´epend du fait d"appartenir `a une sous-population ou`a une autre. 2

Exemple du nombre d"enfants de 0

`a 6 ans selon la structure familiale (exemple 1 du chapitre 6) :

Arrondi4

Effectif

yi y2i y i 2i n i: y i2 n i:2i Mono 1035
1669
3199

1,6126

0,4903

2691,4955

507,4605

Couples

6536
11036
22802

1,6885

0,6376

18634,3468

4167,3536

Total7571127052600121325,8423 4674,8141

Moyenne1,6781 3,43432,81680,6175

Variance 0,6183Inter0,00080,6175Intra

Les moyennes dans les deux sous-populations diff

`erent assez peu (de l"ordre de5%), la variance inter est tr`es faible (0;001) de mˆeme que la variance expliqu ´ee par le facteur “structure familiale" (0:001). 3 Si la variance expliqu´ee est´egale`a 1, la variance intra vaut 0, ce qui entra ˆıne que toutes les variances conditionnelles sont nulles (la variance intra ´etant une somme de nombres positifs ou nuls, elle ne peut valoir0 que si chaque terme est nul). Par cons

´equent, les individus de chaque

sous-population ont tous la m

ˆeme mesureY.

Dans ces conditions, le facteurXd´etermine enti`erement la mesureY: il suffit de conna ˆıtre la sous-population dans laquelle l"individu se trouve pour conna

ˆıtre sa mesureY.

Inversement il suffit de conna

ˆıtre la mesureYd"un individu pour savoir

dans quelle sous-population il se trouve, en supposant que les sous-populations ont toutes des valeurs deYdiff´erentes. 4 Si la variance expliqu´ee est´egale`a 0, la variance inter est nulle, ce qui revient `a dire que les moyennes conditionnelles deYsont identiques :Y donne globalement les m

ˆemes mesures sur toutes les sous-populations.

Cela ne signifie pas

`a proprement parler queXetYsont ind´ependantes (il faudrait pour cela qu"en plus de l"

´egalit´e des moyennes conditionnelles

on ait l" ´egalit´e des distributions conditionnelles), mais que le facteurX n"a pas d"effet global sur la mesure deY. Inversement, siXetYsont ind´ependantes, les moyennes conditionnelles deYsont identiques, la variance inter est donc nulle et la variance expliqu

´ee est´egale`a 0.

5 Si la variance expliqu´ee est proche de 0, la variance inter l"est egalement. Les moyennes deYdans les sous-populations sont peu diff ´erentes les une des autres ; alors de deux choses l"une : ou bien ces diff

´erences sont un effet des fluctuations

d" ´echantillonnage pour des sous-populations de mˆeme moyenne, ce qui revient `a consid´erer que le facteurXn"a pas d"effet sur la variableY. ou bien au contraire, elles sont dues au fait queXa un effet sur laY, sans doute faible, mais suffisant pour rendre les mesures deY diff

´erentes dans les sous-populations.

Ces observations ont donn

´e l"id´ee d"un test pour appr´ecier si des petites diff ´erences entre les moyennes deYdans les sous-populations peuvent etre interpr´et´ees ou non comme l"effet du facteurX. 6

2) Test de l"

´egalit´e des moyennes par l"analyse de la variance Soit T la valeur (nk)var inter var intra calcul

´ee`a partir de l"observation d"un

echantillon de taillen,k´etant le nombre de sous-populations (le nombre de modalit

´es deX). D´efinissons l"hypoth`ese

(H) :les moyennes deYsont identiques dans les sous-populations. Si(H)est vraie alors les valeurs deTcalcul´ees sur diff´erents echantillons vont varier au voisinage de 0, puisque du fait des fluctuations d" ´echantillonnage, les variances inter vontˆetre proches de 0.

Plus pr

´ecis´ement, on sait par des travaux math´ematiques que sous cette hypoth `ese(H), les valeurs deTvarient approximativement comme la distribution du2`ak1degr´es de libert´e. 7

Le principe du test est identique

`a celui du2pour l"ind´ependance statistique:

1:on d´etermine d"abord un seuilsau-del`a duquel les valeurs deTsont

consid ´er´ees comme improbables si l"hypoth`ese(H)est vraie, en utilisant une table des distributions du2qui est la distribution deTdans ce cas. Par exemple, sisest le 95`eme centile, c"est-`a-dires=lk-1(95%), alors

5%seulement des´echantillons peuvent donner pourTune valeur

sup

´erieure`as(en supposant(H)vraie).

2:on calcule la valeurtdeTpour l"´echantillon observ´e.

3:si t > s (i.e.,tfait partie des valeurs improbables si(H)vraie), alors on rejette l"hypoth `ese(H) , en consid

´erant que le facteurXa un effet global

surY(les moyennes deYsont diff´erentes dans les sous-populations). 4 :si t s (i.e., tne fait pas partie des valeurs improbables si(H)vraie), alors on ne rejette pas l"hypoth `ese(H) , en consid

´erant qu"il est possible

que le facteurXn"ait pas d"effet global surY. 8

Exemple du nombre d"enfants de 0

`a 6 ans selon la structure familiale : si la moyenne du nombre d"enfants est identique dans les deux structures familiales (Hypoth `ese(H)), la variableTsuit une loi du

2`a21 = 1degr´e de libert´e ; le 95`eme centile vaut3;84, ce qui

signifie que dans cette hypoth `ese(H),5%seulement des´echantillons donnent une valeur deTsup´erieure`as= 3;84. pour l" ´echantillon observ´e, la valeurtcalcul´ee pourTest´egale`a (75712)0;0008

0;61759;8; si(H)´etait vraie, l"´echantillon serait un

de ces5%d"´echantillons atypiques, ce que nous n"avons pas de raison de penser : nous rejetons donc cette hypoth `ese en admettant que le facteur “structure familiale" a un (faible) effet global sur le nombre d"enfants, puisque les moyennes sont consid

´er´ees comme

diff

´erentes dans les deux sous-populations.

9 On remarquera en passant que la faible valeur de la variance inter conduit quand m ˆeme`a consid´erer comme significative la diff´erence entre les moyennes des deux sous-populations (elle n"est pas l"effet des fluctuations d" ´echantillonnage) ; cela est dˆu`a la grande taille de l"

´echantillon.

En supposant celui-ci de taille 1000,tvaudrait

(10002)0;0008

0;61751;3, ce qui nous aurait amen´e`a ne pas rejeter

l"hypoth `ese d"´egalit´e des moyennes. 10

Chapitre 10. Deux variables

num

´eriques

Dans ce chapitre nous

´etudions la liaison entre deux variables num´eriques. On peut bien entendu appliquer aux deux variables les proc

´edures

etudi´ees dans le cas o`u une seule des deux variables est num´erique.

La nouveaut

´e est que chaque observation´etant un couple de nombres (x;y), elle peutˆetre repr´esent´ee graphiquement par un point d"un plan ; on peut alors faire appel `a des proc´edures g´eom´etriques pour visualiser l"ensemble des observations, et analyser la forme du nuage ainsi form

´e.

Nous pr

´esenterons ensuite la

covariance , un indice de covariation lin

´eaire

des deux variables puis le coefficient de corr

´elation lin´eaire

11

1) Nuage des observations.

Sur un plan, on place un rep

`ere orthonorm´e : l"axe horizontal gradu´e des abscisses qui identifie les valeurs de la variableX, et l"axe vertical gradu´e des ordonn ´ees qui identifie celles de la variableY. L"observation d"un individueest repr´esent´ee par le pointed"abscissexeet d"ordonn´eeye.

L"ensemble des points est le

nuage des observations . La “moyenne conjointe"M(point de coordonn´ees xet y) est appel´ee le centre de gravit

´e du nuage

Exemple : les notes

`a deux partiels de statistique pour un´echantillon de20´etudiants en deuxi`eme ann´ee de psychologie.

1 2 3 4 5 6 7 8 9 10 P1 11,9 11,2 3,6 5,3 13,2 9,9 19,4 3,6 0,3 15,5 P2 10,3 14,4 2,7 6 6,7 6,7 15,2 3 0,3 18,8 P1 11 12 13 14 15 16 17 18 19 20 P1 9,8 10,5 11,6 10 8,5 18,9 15,2 12,9 6,2 7,7 P2 5 9,5 9,3 4,7 3 20 16,7 15,5 6,7 12,8 12

Le nuage :

Pour repr

´esenter l"´etudiant 20 par exemple, on trace une verticale d"abscissex20= 7;7et une horizontale d"ordonn´eey20= 12;8: le point est `a l"intersection des deux droites.

Le centre de gravit

´eMest le point de coordonn´eesxM= 10;3et

y

M= 9;4.

13 Si on trace une verticale d"abscisse 10 et une horizontale d"ordonn

´ee 10,

on d

´ecoupe le plan en quartiers :

- le quartier nord-est contient les

´etudiants qui ont la moyenne aux deux

partiels. - le quartier sud-ouest contient les

´etudiants qui n"ont la moyenne`a aucun

des partiels. - le quartier sud-est contient les

´etudiants qui ont la moyenne au premier

partiel seulement. - le quartier nord-ouest contient ceux qui ont la moyenne au second partiel seulement. 14 Formes de nuage et liaison de variables.Le nuage est l"image de l" ´echantillon vue`a travers le prisme des variablesXetY; l"analyse de sa forme permet d"appr ´ecier la fac¸on dont ces deux variables structurent l" ´echantillon, ou de mani`ere´equivalente la liaison de ces variables qui se manifeste dans l" ´echantillon. Dans l"exemple pr´ec´edent on peut rep´erer trois sous-

´echantillons et 3 observations atypiques.

15 Ind ´ependance.LorsqueXetYsont ind´ependantes, le nuage se r´epartit r ´eguli`erement autour du centre de gravit´e, dans une forme qui d´epend de la distribution des variables ; ci-dessous deux nuages de variables ind ´ependantes, le premier quand elles sont uniform´ement distribu´ees, le second quand leur distribution est en en “cloche". 16

Covariation lin

´eaire.Das ce cas, le nuage s"´etend le long d"une droite imaginaire qui formalise la liaison lin

´eaire entre les deux variables. Le

premier nuage allong ´e le long d"une droite ascendante rend compte d"une covariation positive (ycroˆıt globalement avecx), le second d"une covariation n ´egative (yd´ecroˆıt quandxcroˆıt). 17 Liaison fonctionnelle.Le nuage se disperse le long de la courbe d"une fonction qui exprime la liaison entre les deux variables. 18

2) Covariance

La covariance est une mesure de la variation simultan

´ee des deux

variables , de leur covariation D ´efinition :La covariance d"une s´erie denobservations conjointes de deux variables num

´eriquesXetYest la

“moyenne des produits des

ecarts`a la moyenne" cov(x;y) =∑ i=1;::;n(xi x)(yi y) n

On peut d

´emontrer qu"elle est´egale`a

“la moyenne des produits moins le

produit des moyennes" cov(x;y) =∑ i=1;::;nxiyi n x y: 19

Exemple : Taille des p

`eres et fils ain´es dans 12 familles. 1 2 3 4 5 6 7 8 9 10 11 12 Moy. x 165
160
170
163
173
quotesdbs_dbs31.pdfusesText_37