[PDF] UNIVERSITÉPARISOUESTNANTERRELADÉFENSE L1Économie CoursdeB



Previous PDF Next PDF







Cours 3 Distributions conditionnelles

De manière symétrique, on définit une distribution conditionnelle de Y comme une distri-bution de Y restreinte à un des sous-échantillon conditionné par une modalité de X; il y en donc k : par exemple, la distribution de Y sur le sous-échantillon E m i est la distribution de Y conditionnée par m i, notée Y m i



Chapitre 3 Les distributions à deux variables

Une distribution conditionnelle est une distribution statistique obtenue en la population a un (une classe par exemple) J = 2 )il y a conditionnelles de X par rapport a Y 1 la distribution de X sachant Y 2[800;1000[ 2 la distribution de X sachant Y 2[1000;1200[ I = 3 )il y a distributions conditionnelles de Y par rapport a X



Chapitre 3 Les distributions à deux variables

Une distribution conditionnelle est une distribution statistique obtenue enrestreignantla population a un ev enement particulier(une classe par exemple) J = 2 )il y adeux distributionsconditionnelles de X par rapport a Y 1 la distribution de X sachant Y 2[800;1000[ 2 la distribution de X sachant Y 2[1000;1200[



Statistique descriptive bivariée Distributions jointe

Distribution conditionnelle du personnel de catégorie C par secteur X (Y= C) Administratif Technique Social Sport, culture et animation Police municipale Total Effectifs 24 67 16 4 12 123 Proportions 0 195 0 545 0 130 0 033 0 098 Distribution conditionnelle du personnel de catégorie B par secteur



PROBABILITÉS DISTRIBUTIONS DE PROBABILITÉS

indiqué par la notion de probabilité conditionnelle Définition : Soient A et B deux événements, A étant supposé de probabilité non nulle On appelle probabilité conditionnelle de B par rapport à A, la probabilité de réalisation de l'événement B sachant que A est réalisé On la note : p(B A) = pAB pA () ∩



Distributions de plusieurs variables - UNIGE

Trouver la distribution conjointe de Xet Y X nY 0 1 2 0 6 153 24 153 15 153 1 32 153 48 153 0 2 28 153 00 Distributions 7 Fonctions de densit e conditionnelle



UNIVERSITÉPARISOUESTNANTERRELADÉFENSE L1Économie CoursdeB

ainsi la distribution conditionnelle de la i-ième ligne On note les fréquences obtenuesf jji avecjquivariede1àq: f jji = n ij n i La notation f jji se lit “f indice jsachant i” Il s’agit de la distribution de la variable Y sachant que la variable X est fixée à sa i-ième modalité x i On



Cours 2 Distribution conjointe - Beziers Accueil

4 Statistique pour la psychologie II : E34XP1 Questions de cours 1 Qu’appelle-t-on modalité conjointe? 2 Définition d’une distribution conjointe? 3 Définition d’une distribution marginale? 4 Que désignent les notations x 1 y 3 k p n m 2 m03 c 44 n 12 f 32 n 2 n 3 f 4 f 1 n dans le modèle d’une situation statistique? 5



La statistique bidimensionnelle

Définition: on appelle distribution de X liée pour Y = Yj les valeurs (n1j, n2j, npj par j=1 p Distribution de Y liée pour X = Xi la suite des valeurs (ni1, ni2, niq) pour i=1 p Ex 3 (suite ex 2) : On a le tableau croisé 3 1 1 3 2 0 Déterminons les effectifs des lignes et des colonnes n1 = ∑ n1j = n11 + n12 = 4

[PDF] moyenne marginale exemple

[PDF] distribution marginale statistique exercice corrigé

[PDF] calcul distribution marginale

[PDF] distribution statistique a deux variables

[PDF] distribution conditionnelle statistique exercice corrigé

[PDF] redoublement scolaire pour ou contre

[PDF] tableau de contingence exercice corrigé

[PDF] fréquence cumulée croissante calcul

[PDF] fréquence absolue cumulée croissante

[PDF] commission d appel passage en seconde

[PDF] redoublement terminale refusé

[PDF] dsden

[PDF] recours affectation lycée

[PDF] formule effectif cumulé croissant

[PDF] regulateur de pression d'eau reglage

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE

U.F.R. SEGMI Année universitaire 2018 - 2019

L1 Économie Cours de B. Desgraupes

Statistiques Descriptives

Séance 08: Analyse bivariéeTable des matières

1 Introduction

1

2 Tableaux de contingence

1

3 Distributions marginales

4

3.1 Effectifs marginaux

5

3.2 Moyennes et variances marginales

6

4 Distributions conditionnelles

9

4.1 Fréquences conditionnelles

9

4.2 Moyennes et variances conditionnelles

11

5 Propriétés des caractéristiques marginales et conditionnelles

13

5.1 Relation entre les moyennes

13

5.2 Relations entre les variances

14

6 Représentations graphiques

16

7 Exercices

19 1 Introduction

L"analyse bivariée étudie des populations suivant deux caractères (ou variables) statistiquesXetY. Par exemple, on peut étudier un ensemble de salariés selon l"âge et le sexe, ou un ensemble d"individus selon leur poids et leur taille. Les deux variables observées peuvent être aussi bien quantitatives que quali- tatives. Les tableaux de données seront à deux dimensions : des jeux de données à deux colonnes ou des tableaux d"effectifs à deux entrées. Dans le cas d"une variable quantitative, on pourra faire des calculs d"indicateurs (moyenne, écart-type, etc.) en fonction des modalités de l"autre variable. 1

2 Tableaux de contingence

Lorsque les jeux de données comportent toutes les observations (données exhaus- tives), ils se présentent sous la forme de tables dans lesquelles les observations sont représentées en lignes et les variables sont représentées en colonnes. Par exemple, voici les six premières observations d"un jeu de données con- cernant des tremblements de terre aux Îles Fidji. Les deux variables observées sont la profondeur (en kilomètres) et la magnitude :Profondeur Magnitude

1 562 4.8

2 650 4.2

3 42 5.4

4 626 4.1

5 649 4.0

6 195 4.0

......(extrait du jeu de donnéesquakesdu logiciel R) L"équivalent des tables d"effectif, dans le cadre de l"analyse bivariée, s"appelle tableau de contingence. Il s"agit de tables d"effectif à double entrée. Les deux variables observées sont représentées par leurs modalités. Dans le cas d"une variable continue, on fait un découpage en classes et les modalités sont les intervalles. On place les modalitésxide la variableXen lignes et les modalitésyjde la variableYen colonnes. À l"intersection de la ligneiet de la colonnej, on inscrit le nombrenijd"observations pour lesquelles les deux variables correspondent aux modalitésxietyjrespectivement. On noteraple nombre de modalités de la variableXetqle nombre de modalités de la variableY. Un tableau de contingence a donc la forme suivante :x inyiy

1y2yjyqx

1n

11 ...n1qx

2. ........x i nij.... .....x pn p1 npqIl comporteplignes etqcolonnes.

Exemple1

Le tableau de contingence suivant indique la répartition de 900 familles en fonction du nombre de pièces qu"elles habitent (entre 1 et 6) et du nombre d"enfants (entre 0 et 4) : 2

PnE0 1 2 3 4

18 7 4 1 0

242 58 42 3 1

328 72 124 51 9

411 55 84 101 21

54 23 90 26 20

61 2 4 3 5

C"est un tableau de contingence qui croise deux variablesquantitatives dis- crètes.

Exemple2

Le tableau suivant est un exemple de tableau de contingence construit avec deux variablesqualitatives. Il concerne les candidats à l"Université de Californie

à Berkeley en 1973 et les variables sont le statut (admisourefusé) et le sexe.Garçons Filles

Admis1198 557

Refusés1493 1278

Ces données sont extraites du jeu de donnéesUCBAdmissionsfourni par le logiciel R ( www.r-project.org

Exemple

Les données suivantes, relevées sur un registre d"état-civil, concernent les âges auxquels 100 couples se sont mariés. Elles se présentent sous la forme de paires de valeurs de la forme(xi;yi)oùxiest l"âge du mari etyil"âge de la femme. Ranger ces données dans des classes d"amplitude 5 et construire le tableau de contingence en croisant l"âge du mari et l"âge de la femme. L"âge est ici traité comme une variable quantitative continue puisqu"il est regroupé en sous-classes. Dans les calculs qui suivront, chaque classe sera représentée numériquement par son centre. 3 1 (26,17) (38,29) (22,19) (33,29) (25,20)

2(36,28) (34,22) (28,20) (21,22) (34,31)

3(28,20) (33,23) (28,19) (28,18) (28,20)

4(38,27) (40,29) (27,20) (25,32) (36,24)

5(39,25) (33,32) (23,23) (37,26) (22,18)

6(20,19) (34,23) (22,20) (29,23) (29,21)

7(31,20) (31,24) (24,22) (37,30) (40,34)

8(38,22) (32,24) (29,25) (37,26) (38,29)

9(31,22) (26,18) (25,27) (36,29) (38,32)

10(29,25) (23,17) (38,23) (29,23) (23,19)

11(40,28) (40,36) (20,18) (35,25) (22,17)

12(29,24) (38,30) (29,25) (33,25) (33,23)

13(34,19) (34,26) (36,28) (34,25) (27,21)

14(32,24) (36,25) (22,22) (20,24) (33,21)

15(22,19) (20,27) (31,23) (29,19) (26,20)

16(38,30) (30,27) (24,17) (24,20) (23,25)

17(25,19) (35,20) (22,19) (27,20) (36,29)

18(20,22) (24,21) (35,25) (32,25) (21,23)

19(26,18) (26,27) (38,32) (27,22) (29,19)

20(40,26) (24,22) (27,19) (22,19) (30,18)

En examinant ces données, on se rend compte que les âges des maris sont compris entre 20 et 40 tandis que les âges des femmes sont compris entre 17 et 35. On va donc créer des classes[15;20[,[20;25[, etc. pour regrouper les individus.

On obtient le tableau de contingence suivant :x

inyi[15;20[ [20;25[ [25;30[ [30;35][20;25[11 11 2 0 [25;30[9 13 5 1 [30;35[2 11 6 2 [35;40]0 4 16 7 On observe un seul mariage pour lequel la femme a entre 30 et 35 ans et le mari a entre 25 et 30 ans. Il correspond à l"observation(25;32)sur la 4ème ligne du jeu de données.

3 Distributions marginales

On complète habituellement les tableaux de contingence par une ligne et une colonne supplémentaires dans lesquelles on calcule les sommes des colonnes et rangées respectivement. Si on reprend l"exemple des 900 familles, on obtient le tableau suivant : 4

PnE0 1 2 3 4Total

18 7 4 1 020

242 58 42 3 1146

328 72 124 51 9284

411 55 84 101 21272

54 23 90 26 20163

61 2 4 3 515

Total94 217 348 185 56900

Les sommes partielles qui figurent dans la dernière ligne indiquent le nombre de familles ayant 0, 1, 2, etc. enfants (indépendamment du nombre de pièces qu"elles habitent). Elles constituent une distribution univariée qu"on appelle distribution marginale du nombre d"enfants.Enfants0 1 2 3 4

Effectifs94 217 348 185 56

De même, les sommes partielles qui figurent dans la dernière colonne in- diquent le nombre de familles habitant dans 1, 2, 3, etc. pièces (indépendam- ment du nombre d"enfants qu"elles ont). Elles constituent une distribution qu"on appelledistribution marginale du nombre de pièces.Pièces1 2 3 4 5 6

Effectifs20 146 284 272 163 15

La somme des sommes partielles en lignes et celle des sommes partielles en colonnes sont égales à l"effectif totalNqu"on lit dans la case en bas à droite du tableau de contingence. Si on divise les distributions marginales parN, on obtient les distributions en proportions : pour les enfantsEnfants0 1 2 3 4

Proportions0.10 0.24 0.39 0.21 0.06

pour les piècesPièces1 2 3 4 5 6

Proportions0.02 0.16 0.32 0.30 0.18 0.02

3.1 Effectifs marginaux

Pour désigner les sommes marginales du tableau de contingence, on utilise la notation suivante : nidésigne la somme des effectifs sur lai-ième ligne, autrement dit n i=qX j=1n ijpouri= 1;:::;p 5 njdésigne la somme des effectifs sur laj-ième colonne, autrement dit n j=pX i=1n ijpourj= 1;:::;q

On a la propriété :

N=pX i=1n i=qX j=1n jParfoisNest notén. Le tableau de contingence prend maintenant la forme suivante :x inyiy

1y2yjyqTotal

x 1n

11 ...n1qn

1x 2. ........n 2. ..x i nij.... ..x pn p1 npqn pTotaln

1n2njnqN

On définit aussi des tableaux de contingence en proportions en divisant tous les effectifsnijpar l"effectif totalN. On notefijla fréquence obtenue : f ij=nijN C"est la proportion d"individus correspondant à la fois à la modalitéxiet à la modalitéyj. On peut écrire de la manière suivante : f ij=P(X=xietY=yj)On a aussi les notations et les relations suivantes : f i=qX j=1f ijpouri= 1;:::;p f j=pX i=1f ijpourj= 1;:::;q p X i=1f i=qX j=1f j= 16

Exemple

En reprenant l"exemple des admissions à l"université de Californie, on obtient le tableau de contingence en proportions suivant :Garçons FillesTotal

Admis0.27 0.120.39

Refusés0.32 0.290.61

Total0.59 0.411.00

On a divisé les effectifs parN= 4526.

3.2 Moyennes et variances marginales

Les distributions marginales (qu"elles soient en ligne ou en colonne) sont des distributions univariées et donc on peut leur appliquer toutes les propriétés des distributions à une variable. En particulier, si les variables sontquantitatives, il n"y a aucune difficulté à calculer leur moyenne et leur variance (puis leur écart-type). On les appelle moyennes et variances marginales. Par exemple, la moyenne marginale de la variableX, notéexs"écrira : x=1N p X i=1n ixi=pX i=1f ixiLa moyenne marginale de la variableY, notéeys"écrira : y=1N q X j=1n jyj=qX j=1f jyjSi les variables sontqualitatives, on ne peut pas calculer de moyenne ou d"écart-type.

Pour les variances, on a les formules suivantes :

8>< :V(x) =1N P p i=1ni(xix)2

V(y) =1N

P q j=1nj(yjy)2 On a aussi les formules développées (moyenne des carrés moins carré de la moyenne) : 8>< :V(x) =1N P p i=1nix2i(x)2=Pp i=1fix2i(x)2

V(y) =1N

P q j=1njy2j(y)2=Pq j=1fjy2j(y)2 7

Exemple

Calculer les moyennes et variances marginales dans le cas du tableau des enfants et des pièces d"habitation.

Corrigé

Les variables sont quantitatives discrètes. Faisons les calculs en proportions. Pour les enfants, on a vu qu"on avait la distribution marginale suivante :Enfants0 1 2 3 4

Proportions0,10 0,24 0,39 0,21 0,06

La moyenne marginale du nombre d"enfants est :

y= 0;100 + 0;241 + 0;392 + 0;213 + 0;064 = 1;89

La variance marginale du nombre d"enfants est :

V(y) = 0;10(01;89)2+ 0;24(11;89)2

+ 0;39(21;89)2+ 0;21(31;89)2+ 0;06(41;89)2 = 1;0779

D"où l"écart-type(y) =p1;0779 = 1;038.

Pour le nombre de pièces, on procède de manière analogue à partir de la distribution marginale des pièces trouvée précédemment :Pièces1 2 3 4 5 6

Proportions0,02 0,16 0,32 0,30 0,18 0,02

La moyenne marginale du nombre de pièces est :

x= 0;021 + 0;162 + 0;323 + 0;304 + 0;185 + 0;026 = 3;52 La variance marginale du nombre de pièces est :

V(x) = 0;02(13;52)2+ 0;16(23;52)2+ 0;32(33;52)2

+ 0;30(43;52)2+ 0;18(53;52)2+ 0;02(63;52)2 = 1;1696

D"où l"écart-type(x) =p1;1696 = 1;082.

Exemple

Calculer les moyennes et variances marginales dans le cas du tableau des

âges de mariage.

Corrigé

Chaque classe d"âge va être représentée par son centre. Pour l"âge de la femme (variableY), on obtient la distribution marginale suivante : 8 [15,20)[20,25)[25,30)[30,35]

Âges17,522,527,532,5

Effectifs22392910

Proportions0,220,390,290,10

On trouve les résultats suivants :

moyenne marginale y= 0;2217;5 + 0;3922;5 + 0;2927;5 + 0;1032;5 = 23;85 variance marginale

V(y) = 0;22(17;523;85)2+ 0;39(22;523;85)2

+ 0;29(27;523;85)2+ 0;10(32;523;85)2= 20;9275

D"où l"écart-type(y) =p20;9275 = 4;58.

Pour l"âge du mari (variableX), on procède de la manière. Les résultats sont : (x= 30;05

V(x) = 31;7475 =)(x) = 5;64

4 Distributions conditionnelles

On a calculé les fréquencesfijen divisant les effectifsnijpar l"effectif totalN. Une autre approche intéressante consiste à regarder le tableau de contingence ligne par ligne (ou colonne par colonne). Par exemple, en reprenant l"exemple des 900 familles, isolons la première ligne :Enfants0 1 2 3 4Total

1 pièce8 7 4 1 020

Cette ligne est la distribution de la variable "nombre d"enfants" pour les familles qui habitent dans une pièce. On divise par la somme (égale à 20) des effectifs de cette ligne :Enfants0 1 2 3 4Total

1 pièce0,40 0,35 0,20 0,05 0,001,00

4.1 Fréquences conditionnelles

On interprète la distribution obtenue en disant que, parmi les familes qui habitent un logement d"une pièce, 40% n"ont pas d"enfant, 35% ont un enfant, etc. De manière générale, dans lai-ième ligne, on divise les effectifsnijpar la somme marginale, c"est-à-dire la sommenides effectifs de la ligne. On obtient 9 ainsi ladistribution conditionnellede lai-ième ligne. On note les fréquences obtenuesfjjiavecjqui varie de 1 àq: f jji=nijn iLa notationfjjise lit "findicejsachanti". Il s"agit de la distribution de la variableYsachant que la variableXest fixée à sai-ième modalitéxi. On pourrait écrire ce résultat sous la forme suivante : f jji=P(Y=yjjX=xi)pourj= 1;:::;q

Exemple

Reprenons l"exemple des couples mariés et calculons les distributions con- ditionnelles de la variableY(âge de la femme) conditionnée par la variableX (âge du mari). Le tableau de contingence initial était :[15;20[ [20;25[ [25;30[ [30;35]Total [20;25[11 11 2 024 [25;30[9 13 5 128 [30;35[2 11 6 221 [35;40]0 4 16 727 En divisant chaque ligne par son propre total, on aboutit aux distributions suivantes :[15;20[ [20;25[ [25;30[ [30;35]Total [20;25[0.46 0.46 0.08 0.001.00 [25;30[0.32 0.46 0.18 0.041.00 [30;35[0.10 0.52 0.29 0.101.00 [35;40]0.00 0.15 0.59 0.261.00 On constate, par exemple, que parmi les hommes dans la tranche[25;30[,

4% ont épousé une femme ayant entre 30 et 35 ans.

Il faut bien noter que ce résultat n"a aucune espèce de généralité : il corre- spond uniquement à l"échantillon de 100 couples qui a été étudié. Le sens du mot "conditionnel" est le fait qu"on fixe la valeur de l"indicei lorsqu"on se place dans lai-ième ligne, autrement dit on impose la "condition" X=xi. On peut aussi procéder en colonnes afin d"obtenir les distributions condition- nelles de la variableXconditionnées par la valeur deY. Dans laj-ième colonne, on divise les effectifsnijpar la somme marginale, c"est-à-dire la sommenjdes effectifs de laj-ième colonne. On obtient ainsi la distribution conditionnelle de laj-ième colonne. On note les fréquences obtenuesfijjaveciqui varie de 1 àp f ijj=nijn j10 Il s"agit de la distribution de la variableXsachant que la variableYest fixée à saj-ième modalitéyj. On pourrait écrire ce résultat sous la forme suivante : f ijj=P(X=xijY=yj)pouri= 1;:::;p

Exemple

Prenons à nouveau l"exemple des couples mariés et calculons les distributions conditionnelles de la variableX(âge du mari) conditionnée par la variableY (âge de la femme). Le tableau de contingence initial était :[15;20[ [20;25[ [25;30[ [30;35][20;25[11 11 2 0 [25;30[9 13 5 1 [30;35[2 11 6 2 [35;40]0 4 16 7

Total22 39 29 10

En divisant chaque colonne par son propre total, on aboutit aux distributions suivantes :[15;20[[20;25[[25;30[[30;35][20;25[0.500.280.070.00 [25;30[0.410.330.170.10 [30;35[0.090.280.210.20 [35;40]0.000.100.550.70

Total1.001.001.001.00

On constate, par exemple, que parmi les femmes dans la tranche[20;25[,

28% ont épousé un homme ayant entre 30 et 35 ans.

Remarques :

Les tableaux des distributions conditionnelles ne sont pas des tableaux de contingence. La présentation sous forme de tableau est une commodité. Le tableau des distributions conditionnelles deXsachantYet celui deY sachantXdoivent être lus dans le bon sens, le premier en colonnes et le second en lignes. Il y apdistributions conditionnelles deYsachantXetqdistributions conditionnelles deXsachantY. Il existe des relations entre les fréquences marginales et les fréquences con- ditionnelles : f ijj=nijn j=nij=Nn j=N=fijf j

On en déduit que :

f ij=fijjfj 11 En échangeant le rôle deiet dej, on montrerait qu"on a de même la relation suivante : f ij=fjjifi()fjji=fijf i Les deux tableaux de distributions conditionnelles sont donc reliés entre eux par : f jji=fijjfjf i4.2 Moyennes et variances conditionnelles Chaque distribution conditionnelle (en ligne ou en colonne) peut être considérée isolément comme une distribution univariée. Si elle correspond à une variable quantitative, on peut donc lui associer n"importe lequel des indicateurs usuels des distributions à une variable (moyenne, variance, écart-type, etc.). On obtient ainsi en particulierpmoyennes et variances pour les distributionsquotesdbs_dbs5.pdfusesText_10