“variance totale = variance intra + variance inter”, la variance intra, moyenne des variances (conditionnelles), quantifie la part de la variabilité intrins`eque de Y
Previous PDF | Next PDF |
[PDF] Chapitre 9 Analyse de la variance
“variance totale = variance intra + variance inter”, la variance intra, moyenne des variances (conditionnelles), quantifie la part de la variabilité intrins`eque de Y
[PDF] Cours 11 Une variable numérique : dispersion et variance Variance
variance comme indice de dispersion, mesure de l'éparpillement des intra + variance inter , ou encore variance totale = moyenne des variances + variance
[PDF] TD Statistique : Chapitre 8
Total 82 92 178 217 166 84 19 838 1 Calculer les 3 variances et les écart- types correspondants Calcul de la variance intra + variance inter Moyenne
[PDF] TD1 : Moyenne et Variance
5) Calculer la variance des salaires dans l'usine A puis dans l'usine B 1) la variance totale σ2, 2) la variance intra-groupe σ2 intra, 3) la variance inter- groupe σ2 inter Chaque variance doit être calculée directement à partir de sa définition
[PDF] Chapitre 7
L'analyse de la variance (ANOVA) a pour objectif d'étudier l'influence d'un ou différents groupes : écart des moyennes des groupes à la moyenne totale) à variabilité à l'intérieur des classes, d'où le nom de variance intra-classes (intra-
[PDF] Cours 8 : Analyse de variance à un facteur - uOttawa
Pour des raisons de généralisation, le chercheur a tout intérêt à tester additive (variance totale ≠ variance intra groupe + variance intergroupe) Par contre,
[PDF] Statistique descriptive - Nathalie Vialaneix
12 jan 2011 · Calculer la variance inter-groupes, la variance intra-groupes puis la variance totale de la note de goût pour les bières des deux pays Réponse
[PDF] Analyse de la Variance
On utilisera ici la mesure de variance afin de déterminer le caractère significatif, ou non, des Variabilité totale = var due au facteur étudié + var naturelle (ou intrinsèque) que celle entre observations à l'intérieur de chacun des groupes ??
[PDF] ANALYSE DE LA VARIANCE Plan : - cloudfrontnet
L'analyse de variance a pour objectif d'expliquer les variations d'une variable mesurée au La variation totale, c'est-à-dire la somme des carrés des écarts entre toutes résiduelle, en revanche, est mesurée à l'intérieur de chaque groupe et tend G La variance intra-groupe (la somme moyenne des écarts carrés entre
[PDF] TABLEAU DE DETERMINATION DU RESULTAT FISCAL
[PDF] Guide méthodologique à usage des entreprises - Etablissement
[PDF] 26 chaabane 1437 - Portail Marocain des Marchés Publics
[PDF] Guide méthodologique à usage des entreprises - Etablissement
[PDF] Guide méthodologique à usage des entreprises - Etablissement
[PDF] Informations sur le décompte de traitement Madame - EPFL
[PDF] Déconcentration et décentralisation
[PDF] Dissertation TD n°3 Sujet : La décentralisation - cloudfrontnet
[PDF] Dissertation TD n°3 Sujet : La décentralisation - cloudfrontnet
[PDF] Déconcentration et décentralisation
[PDF] Architecture intérieure / Design
[PDF] harmonie des couleurs et finitions - Kinnarps
[PDF] LES PROVINCES ETE LES CHEFS LIEUX
[PDF] Chapitre 2 : Organisation institutionnelle administrative et judiciaire
![[PDF] Chapitre 9 Analyse de la variance [PDF] Chapitre 9 Analyse de la variance](https://pdfprof.com/Listes/38/10608-38Cours2E46.pdf.pdf.jpg)
Chapitre 9. Analyse de la variance
Dans ce chapitre nous
´etudions comment l"analyse de la variance deY
permet de tester l" ´egalit´e des moyennes conditionnelles de cette variable num ´erique dans les sous-populations induites parX. Dans cette probl ´ematique,Xest appel´ee lavariable explicative, ou le facteur explicatif, etYlavariable expliqu´ee.Dans la formule de la d
´ecomposition de la variance,
variance totale = variance intra + variance inter", la variance intra, moyenne des variances (conditionnelles), quantifie la part de la variabilit ´e intrins`eque deY, et la variance inter, variance des moyennes (conditionnelles), mesure l"h ´et´erog´en´eit´e des sous-populations. 11) Variance expliqu
´ee
D´efinition:La
variance expliqu´ee par la variableX
est´egale`a la
variance inter divis´ee par la variance globale deY
C"est un nombre compris entre0et1puisque les variances sont des nombres positifs ou nuls, et que la variance inter est une part de la variance globale.La variance expliqu
´ee est une mesure du lien entre le facteurXet la mesure num ´eriqueY, pour appr´ecier commentYd´epend du fait d"appartenir `a une sous-population ou`a une autre. 2Exemple du nombre d"enfants de 0
`a 6 ans selon la structure familiale (exemple 1 du chapitre 6) :Arrondi4
Effectif
yi y2i y i 2i n i: y i2 n i:2i Mono 10351669
3199
1,6126
0,4903
2691,4955
507,4605
Couples
653611036
22802
1,6885
0,6376
18634,3468
4167,3536
Total7571127052600121325,8423 4674,8141
Moyenne1,6781 3,43432,81680,6175
Variance 0,6183Inter0,00080,6175Intra
Les moyennes dans les deux sous-populations diff
`erent assez peu (de l"ordre de5%), la variance inter est tr`es faible (0;001) de mˆeme que la variance expliqu ´ee par le facteur structure familiale" (0:001). 3 Si la variance expliqu´ee est´egale`a 1, la variance intra vaut 0, ce qui entra ˆıne que toutes les variances conditionnelles sont nulles (la variance intra ´etant une somme de nombres positifs ou nuls, elle ne peut valoir0 que si chaque terme est nul). Par cons´equent, les individus de chaque
sous-population ont tous la mˆeme mesureY.
Dans ces conditions, le facteurXd´etermine enti`erement la mesureY: il suffit de conna ˆıtre la sous-population dans laquelle l"individu se trouve pour connaˆıtre sa mesureY.
Inversement il suffit de conna
ˆıtre la mesureYd"un individu pour savoir
dans quelle sous-population il se trouve, en supposant que les sous-populations ont toutes des valeurs deYdiff´erentes. 4 Si la variance expliqu´ee est´egale`a 0, la variance inter est nulle, ce qui revient `a dire que les moyennes conditionnelles deYsont identiques :Y donne globalement les mˆemes mesures sur toutes les sous-populations.
Cela ne signifie pas
`a proprement parler queXetYsont ind´ependantes (il faudrait pour cela qu"en plus de l"´egalit´e des moyennes conditionnelles
on ait l" ´egalit´e des distributions conditionnelles), mais que le facteurX n"a pas d"effet global sur la mesure deY. Inversement, siXetYsont ind´ependantes, les moyennes conditionnelles deYsont identiques, la variance inter est donc nulle et la variance expliqu´ee est´egale`a 0.
5 Si la variance expliqu´ee est proche de 0, la variance inter l"est egalement. Les moyennes deYdans les sous-populations sont peu diff ´erentes les une des autres ; alors de deux choses l"une : ou bien ces diff´erences sont un effet des fluctuations
d" ´echantillonnage pour des sous-populations de mˆeme moyenne, ce qui revient `a consid´erer que le facteurXn"a pas d"effet sur la variableY. ou bien au contraire, elles sont dues au fait queXa un effet sur laY, sans doute faible, mais suffisant pour rendre les mesures deY diff´erentes dans les sous-populations.
Ces observations ont donn
´e l"id´ee d"un test pour appr´ecier si des petites diff ´erences entre les moyennes deYdans les sous-populations peuvent etre interpr´et´ees ou non comme l"effet du facteurX. 62) Test de l"
´egalit´e des moyennes par l"analyse de la variance Soit T la valeur (nk)var inter var intra calcul´ee`a partir de l"observation d"un
echantillon de taillen,k´etant le nombre de sous-populations (le nombre de modalit´es deX). D´efinissons l"hypoth`ese
(H) :les moyennes deYsont identiques dans les sous-populations. Si(H)est vraie alors les valeurs deTcalcul´ees sur diff´erents echantillons vont varier au voisinage de 0, puisque du fait des fluctuations d" ´echantillonnage, les variances inter vontˆetre proches de 0.Plus pr
´ecis´ement, on sait par des travaux math´ematiques que sous cette hypoth `ese(H), les valeurs deTvarient approximativement comme la distribution du2`ak1degr´es de libert´e. 7Le principe du test est identique
`a celui du2pour l"ind´ependance statistique:1:on d´etermine d"abord un seuilsau-del`a duquel les valeurs deTsont
consid ´er´ees comme improbables si l"hypoth`ese(H)est vraie, en utilisant une table des distributions du2qui est la distribution deTdans ce cas. Par exemple, sisest le 95`eme centile, c"est-`a-dires=lk-1(95%), alors5%seulement des´echantillons peuvent donner pourTune valeur
sup´erieure`as(en supposant(H)vraie).
2:on calcule la valeurtdeTpour l"´echantillon observ´e.
3:si t > s (i.e.,tfait partie des valeurs improbables si(H)vraie), alors on rejette l"hypoth `ese(H) , en consid´erant que le facteurXa un effet global
surY(les moyennes deYsont diff´erentes dans les sous-populations). 4 :si t s (i.e., tne fait pas partie des valeurs improbables si(H)vraie), alors on ne rejette pas l"hypoth `ese(H) , en consid´erant qu"il est possible
que le facteurXn"ait pas d"effet global surY. 8Exemple du nombre d"enfants de 0
`a 6 ans selon la structure familiale : si la moyenne du nombre d"enfants est identique dans les deux structures familiales (Hypoth `ese(H)), la variableTsuit une loi du2`a21 = 1degr´e de libert´e ; le 95`eme centile vaut3;84, ce qui
signifie que dans cette hypoth `ese(H),5%seulement des´echantillons donnent une valeur deTsup´erieure`as= 3;84. pour l" ´echantillon observ´e, la valeurtcalcul´ee pourTest´egale`a (75712)0;00080;61759;8; si(H)´etait vraie, l"´echantillon serait un
de ces5%d"´echantillons atypiques, ce que nous n"avons pas de raison de penser : nous rejetons donc cette hypoth `ese en admettant que le facteur structure familiale" a un (faible) effet global sur le nombre d"enfants, puisque les moyennes sont consid´er´ees comme
diff´erentes dans les deux sous-populations.
9 On remarquera en passant que la faible valeur de la variance inter conduit quand m ˆeme`a consid´erer comme significative la diff´erence entre les moyennes des deux sous-populations (elle n"est pas l"effet des fluctuations d" ´echantillonnage) ; cela est dˆu`a la grande taille de l"´echantillon.
En supposant celui-ci de taille 1000,tvaudrait
(10002)0;00080;61751;3, ce qui nous aurait amen´e`a ne pas rejeter
l"hypoth `ese d"´egalit´e des moyennes. 10Chapitre 10. Deux variables
num´eriques
Dans ce chapitre nous
´etudions la liaison entre deux variables num´eriques. On peut bien entendu appliquer aux deux variables les proc´edures
etudi´ees dans le cas o`u une seule des deux variables est num´erique.La nouveaut
´e est que chaque observation´etant un couple de nombres (x;y), elle peutˆetre repr´esent´ee graphiquement par un point d"un plan ; on peut alors faire appel `a des proc´edures g´eom´etriques pour visualiser l"ensemble des observations, et analyser la forme du nuage ainsi form´e.
Nous pr
´esenterons ensuite la
covariance , un indice de covariation lin´eaire
des deux variables puis le coefficient de corr´elation lin´eaire
111) Nuage des observations.
Sur un plan, on place un rep
`ere orthonorm´e : l"axe horizontal gradu´e des abscisses qui identifie les valeurs de la variableX, et l"axe vertical gradu´e des ordonn ´ees qui identifie celles de la variableY. L"observation d"un individueest repr´esent´ee par le pointed"abscissexeet d"ordonn´eeye.L"ensemble des points est le
nuage des observations . La moyenne conjointe"M(point de coordonn´ees xet y) est appel´ee le centre de gravit´e du nuage
Exemple : les notes
`a deux partiels de statistique pour un´echantillon de20´etudiants en deuxi`eme ann´ee de psychologie.
1 2 3 4 5 6 7 8 9 10 P1 11,9 11,2 3,6 5,3 13,2 9,9 19,4 3,6 0,3 15,5 P2 10,3 14,4 2,7 6 6,7 6,7 15,2 3 0,3 18,8 P1 11 12 13 14 15 16 17 18 19 20 P1 9,8 10,5 11,6 10 8,5 18,9 15,2 12,9 6,2 7,7 P2 5 9,5 9,3 4,7 3 20 16,7 15,5 6,7 12,8 12Le nuage :
Pour repr
´esenter l"´etudiant 20 par exemple, on trace une verticale d"abscissex20= 7;7et une horizontale d"ordonn´eey20= 12;8: le point est `a l"intersection des deux droites.Le centre de gravit
´eMest le point de coordonn´eesxM= 10;3et
yM= 9;4.
13 Si on trace une verticale d"abscisse 10 et une horizontale d"ordonn´ee 10,
on d´ecoupe le plan en quartiers :
- le quartier nord-est contient les´etudiants qui ont la moyenne aux deux
partiels. - le quartier sud-ouest contient les´etudiants qui n"ont la moyenne`a aucun
des partiels. - le quartier sud-est contient les´etudiants qui ont la moyenne au premier
partiel seulement. - le quartier nord-ouest contient ceux qui ont la moyenne au second partiel seulement. 14 Formes de nuage et liaison de variables.Le nuage est l"image de l" ´echantillon vue`a travers le prisme des variablesXetY; l"analyse de sa forme permet d"appr ´ecier la fac¸on dont ces deux variables structurent l" ´echantillon, ou de mani`ere´equivalente la liaison de ces variables qui se manifeste dans l" ´echantillon. Dans l"exemple pr´ec´edent on peut rep´erer trois sous-´echantillons et 3 observations atypiques.
15 Ind ´ependance.LorsqueXetYsont ind´ependantes, le nuage se r´epartit r ´eguli`erement autour du centre de gravit´e, dans une forme qui d´epend de la distribution des variables ; ci-dessous deux nuages de variables ind ´ependantes, le premier quand elles sont uniform´ement distribu´ees, le second quand leur distribution est en en cloche". 16Covariation lin
´eaire.Das ce cas, le nuage s"´etend le long d"une droite imaginaire qui formalise la liaison lin´eaire entre les deux variables. Le
premier nuage allong ´e le long d"une droite ascendante rend compte d"une covariation positive (ycroˆıt globalement avecx), le second d"une covariation n ´egative (yd´ecroˆıt quandxcroˆıt). 17 Liaison fonctionnelle.Le nuage se disperse le long de la courbe d"une fonction qui exprime la liaison entre les deux variables. 182) Covariance
La covariance est une mesure de la variation simultan´ee des deux
variables , de leur covariation D ´efinition :La covariance d"une s´erie denobservations conjointes de deux variables num´eriquesXetYest la
moyenne des produits des
ecarts`a la moyenne" cov(x;y) =∑ i=1;::;n(xi x)(yi y) nOn peut d
´emontrer qu"elle est´egale`a
la moyenne des produits moins le
produit des moyennes" cov(x;y) =∑ i=1;::;nxiyi n x y: 19Exemple : Taille des p
`eres et fils ain´es dans 12 familles. 1 2 3 4 5 6 7 8 9 10 11 12 Moy. x 165160
170
163
173
quotesdbs_dbs31.pdfusesText_37