[PDF] [PDF] Distributions déchantillonnage

moyenne, l'écart-type et le pourcentage — Les mesures que l'on Une valeur moyenne (la moyenne des moyennes d'échantillons, vous sui- vez toujours ?)



Previous PDF Next PDF





[PDF] (Calcul - Pourcentages, vitesse, échelle)

Pourcentage, vitesse et échelle Pourcentage La vitesse moyenne d'un mobile sur une distance et pendant une durée est une vitesse fictive correspondant à 



[PDF] Estimation des paramètres à partir du pourcentage, et de la moyenne

μ=? a- Ecart type de la moyenne: Il faut savoir que la M est elle-même une variable aléatoire



[PDF] Cours de statistique descriptive

О La moyenne simple : calculée à partir d'un tableau élémentaire où à chaque élément ne О fi =100 * fi / N (fréquence en pourcentage) ❑ La somme des 



[PDF] Chapitre n°8 : « Statistiques »

I Moyenne et médiane dessus • Moyenne : il faut faire la somme de toutes les tailles puis diviser par l'effectif total Exemple 3 : pourcentage d'augmentation



[PDF] Statistiques 1 Rappels sur les proportions et pourcentages

Si les valeurs de la série sont regroupées en classes, on peut calculer une valeur approchée de la moyenne en prenant comme valeurs les centres des classes



[PDF] Distributions déchantillonnage

moyenne, l'écart-type et le pourcentage — Les mesures que l'on Une valeur moyenne (la moyenne des moyennes d'échantillons, vous sui- vez toujours ?)



[PDF] Fiche dexercices statistiques - Promath

2) Calculer la note moyenne de ce devoir En donner la valeur arrondie au dixième de point 3) Quel pourcentage, arrondi à l'unité, de l'effectif total représentent 

[PDF] Moyenne, pourcentage d'une classe

[PDF] Moyenne, probabilités

[PDF] moyenne, quartiles ect

[PDF] Moyenne, variance et ecart-type

[PDF] moyenne/médiane/étendue

[PDF] Moyennes

[PDF] Moyennes arithmétiques

[PDF] Moyennes et fonctions

[PDF] Moyennes et pourcentage

[PDF] Moyennes et pourcentages

[PDF] Moyennes Mathématiques

[PDF] Moyennes Pour statistique

[PDF] moyens de production d'électricité

[PDF] moyens de protection du sol

[PDF] moyens de recherche d'emploi ofppt

Chapitre 3

Distributions

d'echantillonnage

3.1 Generalites sur la notion d'echantillonnage

3.1.1 Population et echantillon

On appelle population la totalite des unites de n'importe quel genre prises en consideration par le statisticien. Elle peut ^etre nie ou innie. Un echantillon est un sous-ensemble de la population etudiee. Qu'il traite un echantillon ou une population, le statisticien decrit habi- tuellement ces ensembles a l'aide de mesures telles que le nombre d'unites, la moyenne, l'ecart-type et le pourcentage. | Les mesures que l'on utilise pour decrire une population sont des pa- rametres. Un parametre est une caracteristique de la population. | Les mesures que l'on utilise pour decrire un echantillon sont appelees des statistiques. Une statistique est une caracteristique de l'echantillon. Nous allons voir dans ce chapitre et dans le suivant comment les resultats obtenus sur un echantillon peuvent ^etre utilises pour decrire la population. On verra en particulier que les statistiques sont utilisees pour estimer les parametres. An de ne pas confondre les statistiques et les parametres, on utilise des notations dierentes, comme le presente le tableau recapitulatif suivant. 1

2CHAPITRE 3. DISTRIBUTIONS D'ECHANTILLONNAGEPOPULATION

ECHANTILLOND

EFINITIONC'est l'ensemble des unitesC'est un sous-ensemble de la considerees par le statisticien.population choisie pour etude.

CARACT

ERISTIQUESCe sont les parametresCe sont les statistiques NOTATIONSN = taille de la populationn = taille de l'echantillon (si elle est nie) Si on etudie unmoyenne de la populationmoyenne de l'echantillon caractere quantitatifm=1N P N i=1xix=1n P n i=1xiecart-type de la populationecart-type de l'echantillon pop=q1 N P N i=1(xim)2 ech=q1 n P n i=1(xix)2Si on etudie unproportion dans la populationproportion dans l'echantillon caractere qualitatifpf

3.1.2 L'echantillonage

Avantages de l'echantillonnage

| Co^ut moindre. | Gain de temps. | C'est la seule methode qui donne des resultats dans le cas d'un test destructif.

Methodes d'echantillonnage

Echantillonnage sur la base du jugement (par exemple, dans les cam- pagnes electorales certains districts electoraux sont des indicateurs ables de l'opinion publique). |Echantillonnage aleatoire simple. Tous les echantillons possibles de m^eme taille ont la m^eme probabilite d'^etre choisis et tous les elements de la population ont une chance egale de faire partie de l'echantillon (On utilise souvent une table de nombres aleatoires pour s'assurer que le choix des elements s'eectue vraiment au hasard). Remarque 1Il existe deux autres methodes d'echantillonnage aleatoire mais elles ne nous interessent pas ici . Ce sont l'echantillonnage stratie et l'echantil- lonnage par grappes. Bien entendu, seul l'echantillonnage aleatoire nous permettra de juger objective- ment de la valeur des estimations faites sur les caracteristiques de la population.

Inconvenient de l'echantillonnage

L'echantillonnage a pour but de fournir susamment d'informations pour pouvoir faire des deductions sur les caracteristiques de la population. Mais bien entendu, les resultats obtenus d'un echantillon a l'autre vont ^etre en general dierents et dierents egalement de la valeur de la caracteristique correspon- dante dans la population. On dit qu'il y a des uctuations d'echantillonnage. Comment, dans ce cas, peut-on tirer des conclusions valables? En determinant les lois de probabilites qui regissent ces uctuations. C'est l'objet de ce chapitre.

3.2. LA VARIABLE AL

EATOIRE : MOYENNE D'ECHANTILLON3

3.2 La variable aleatoire : moyenne d'echantillon

3.2.1 Introduction

Position du probleme :

Si nous prelevons un echantillon de taillendans une population donnee, la moyenne de l'echantillon nous donnera une idee approximative de la moyenne de la population. Seulement si nous prelevons un autre echantillon de m^eme taille, nous obtiendrons une autre moyenne d'echantillon. Sur l'ensemble des echantillons possibles, on constatera que certains ont une moyenne proche de la moyenne de la population et que d'autres ont une moyenne qui s'en ecarte davantage.

Comment traiter le probleme?

Un echantillon de taillen(appele aussi unn-echantillon), obtenu par echan- tillonnage aleatoire, va ^etre considere comme le resultat d'une experience aleatoi- re. A chaque echantillon de taillenon peut associer la valeur moyenne des elements de l'echantillon. On a donc deni une variable aleatoire qui a chaque n-echantillon associe sa moyenne echantillonnale. On la noteX. Cette variable aleatoire possede bien entendu : | Une distribution de probabilite. | Une valeur moyenne (la moyenne des moyennes d'echantillons, vous sui- vez toujours?). | Un ecart-type. Le but de ce paragraphe est de determiner ces trois elements. Avant de continuer, essayons de comprendre sur un exemple ce qui se passe. Exemple 2Une population est constituee de 5 etudiants en statistique (le faible eectif n'est pas d^u a un manque d'inter^et pour la matiere de la part des etudiants mais au desir de ne pas multiplier inutilement les calculs qui vont suivre! ). Leur professeur s'interesse au temps hebdomadaire consacre a l'etude des statistiques par chaque etudiant.

On a obtenu les resultats suivants.

EtudiantTemps d'etude (en heures)

A7 B3 C6 D10 E4

Total30

La moyenne de la population estm= 30=5 = 6.

Si le professeur choisit un echantillon de taille 3, quelles sont les dierentes valeurs possibles pour la moyenne de son echantillon? Quelle relation existe-t-il entre cette moyenne d'echantillon et la veritable moyenne 6 de la population? Toutes les possibilites sont regroupees dans le tableau ci-dessous.

4CHAPITRE 3. DISTRIBUTIONS D'ECHANTILLONNAGENumero de

EchantillonValeurs du temps d'etudeMoyennes de

l'echantillondans cet echantillonl' echantillon

1A, B, C7,3,65.33

2A, B, D7,3,106.67

3A, B, E7,3,44.67

4A, C, D7,6,107.67

5A, C, E7,6,45.67

6A, D, E7,10,47.00

7B, C, D3,6,106.33

8B, C, E3,6,44.33

9B, D, E3,10,45.67

10C, D, E6,10,46.67

Total60.00

On constate que :

| Il y a 10 echantillons (C35= 10). | La moyenne des echantillons varie entre 4.33 et 7.67, ce qui signie que la distribution des moyennes d'echantillon est moins dispersee que la distribution des temps d'etude des etudiants, situee entre 3 et 10. | Il est possible que deux echantillons aient la m^eme moyenne. Dans cet exemple, aucun n'a la moyenne de la population (m= 6). | La moyenne des moyennes d'echantillon estE(X) = 60=10 = 6. En fait, nous allons voir que le fait que l'esperance deX(c'est-a-dire la moyenne des moyennes d'echantillon ) est egale a la moyenne de la population n'est pas verie seulement dans notre exemple. C'est une loi generale. Bien, me direz-vous, mais pourquoi faire tout cela? Dans la realite, on ne choisit qu'un seul echantillon. Alors comment le professeur de statistique qui ne conna^t qu'une seule moyenne d'echantillon pourra-t-il deduire quelque chose sur la moyenne de la population? Tout simplement en examinant \jusqu'a quel point" la moyenne d'un echantillon unique s'approche de la moyenne de la po-

pulation. Pour cela, il lui faut la distribution theorique de la variable aleatoireXainsi que l'ecart-type de cette distribution.

3.2.2 Etude de la variable : moyenne d'echantillon

Denition de la variable

On considere une population dont les elements possedent un caractere me- surable qui est la realisation d'une variable aleatoireXqui suit une loi de probabilite d'esperancemet d'ecart-typepop. On suppose que la population est innie ou si elle est nie que l'echantillonnage se fait avec remise. | On preleve un echantillon aleatoire de taillenet on mesure les valeurs de Xsur chaque element de l'echantillon. On obtient une suite de valeurs x

1;x2;:::;xn.

| Si on preleve un deuxieme echantillon toujours de taillen, la suite des valeurs obtenues estx01;x02;:::;x0n, puisx001;x002;:::;x00n... etc... pour des echantillons supplementaires. x

1,x01,x001,... peuvent ^etre considerees comme les valeurs d'une variable

aleatoireX1qui suit la loi deX. De m^eme,x2,x02,x002,... peuvent ^etre considerees comme les valeurs d'une variable aleatoireX2qui suit aussi la loi deX, ... et

3.2. LA VARIABLE AL

EATOIRE : MOYENNE D'ECHANTILLON5

x n,x0n,x00n,... celles d'une variable aleatoireXnqui suit encore et toujours la m^eme loi, celle deX. |X1pourrait se nommer \valeur du premier element d'un echantillon". X

2pourrait se nommer \valeur du deuxieme element d'un echantillon".

....Xnpourrait se nommer \valeur dun-ieme element d'un echantillon". | L'hypothese d'une population innie ou d'un echantillonnage avec remise nous permet d'armer que cesnvariables aleatoires sont independantes. Rappel sur les notations : Par convention, on note toujours les variables aleatoires a l'aide de lettres majuscules (Xi) et les valeurs qu'elles prennent dans une realisation a l'aide de lettres minuscules (xi). Si les valeurs prises parXdans unechantillon sontx1;x2;:::;xn, la moyenne xde l'echantillon est donnee par x=1n (x1++xn) =1n n X i=1x i. Cette valeur n'est rien d'autre que la valeur prise dans cet echantillon de la variable aleatoire 1n (X1++Xn) =1n n X i=1X i. Denition 3On denit donc lavariable aleatoiremoyenne d'echantillonX par X=1n (X1++Xn) =1n n X i=1X i:

Parametres descriptifs de la distribution

On applique les proprietes de l'esperance et de la variance etudiees au cha- pitre 2. |E(X) =1n P n i=1E(Xi) =nmn =m, car les variables suivent toutes la m^eme loi d'esperancem. |V ar(X) =1n 2Pn i=1V ar(Xi) =n2 popn 2=2 popn , car les variables suivent toutes la m^eme loi de variance et sont independantes.

Proposition 4

E(X) =m; V ar(X) =2popn

Remarque 51. Nous venons de demontrer ce que nous avions constate sur notre exemple : la moyenne de la distribution d'echantillonnage des moyennes est egale a la moyenne de la population.

2. On constate que plusncro^t, plusV ar(X)decro^t.

Dans l'exemple d'introduction, nous avions en eet constate que la distribution des moyennes d'echantillon etait moins dispersee que la distribution initiale. En eet, a mesure que la taille de l'echantillon augmente, nous avons acces a une plus grande quantite d'informations pour estimer la moyenne de la popula- tion. Par consequent, la dierence probable entre la vraie valeur de la moyenne de la population et la moyenne echantillonnale diminue. L'etendue des valeurs possibles de la moyenne echantillonnale diminue et le degre de dispersion de la distribution aussi.(X) est aussi appele l'erreur-typede la moyenne.

6CHAPITRE 3. DISTRIBUTIONS D'ECHANTILLONNAGE

On peut schematiser le passage de la distribution de la variable aleatoireX a celle de la variable aleatoireXen passant par les dierents echantillons par le graphique ci-apres.la distribution x /(01*2,32 $4+33*((2,32 5 m -6 6 .6 pop .+82,,2#$2#!"#7+7*!"'%+,

03"('!type de la population

9"!2*(&#$2&#*,%'0&#$2#!"#7+7*!"'%+,

/(01*2,32 $4+33*((2,32 5

6#03"('!type de la distribution de l'échantillon

6#9"!2*(&#$2&#*,%'0&#$2#!403>",'%!!+,-

ech /(01*2,32 $4+33*((2,32 5 ?"#$%&'(%)*'%+,#$2 !"#7+7*!"'%+, @+*(,%'#!2&#$+,,02&

7+*(#0'")!%(

$+,,02&

03>",'%!!+,,"!2&

pop,6 6

03"('!type de la distribution d'échantillonnage des moyennes

$%@@0(2,'2& $403>",'%!!+,&

7+*(#0'")!%(

@+*(,%&&2,'#!2& $2&#.+82,,2& $403>",'%!!+,,"A2Mais conna^tre les parametres descriptifs de la distribution de

Xne sut

pas. Il faut conna^tre aussi sa distribution de probabilite. On se demande alors : depend elle

1. de la distribution deX?

2. de la taillende l'echantillon?

3.3. LA VARIABLE AL

EATOIRE : VARIANCE D'ECHANTILLON7

3.3 La variable aleatoire : variance d'echantillon

La variance2ech=1n

n X i=1(xix)2d'unn-echantillon est la realisation de la variable aleatoire

2ech=1n

n X i=1(XiX)2. On peut se demander si cette variable possede la m^eme propriete que la variable moyenne d'echantillon, c'est-a-dire si l'esperance de

2echest egale a la variance de la population.

3.3.1 Esperance de la variable aleatoire2ech

Autre expression de2ech

2ech=1n

n X i=1(XiX)2 1n n X i=1(Xim+mX)2 1n n X i=1(Xim)2+2n n X i=1(Xim)(mX) +1n n X i=1(mX)2 =A+B+C;

Or,B=2n

(mX)nX i=1(Xim) =2(mX)2etC= (mX)2. On en deduit que

2ech=1n

n X i=1(Xim)2(Xm)2:

Esperance de2ech

Proposition 6

E(2ech) =n1n

2pop:

Preuve.

E(2ech) =1n

n X i=1E((Xim)2)E((Xm)2) 1n n X i=1V ar(Xi)V ar(X) =2pop1n

2pop=n1n

2pop: Conclusion. La moyenne des variances d'echantillon n'est pas la variance de la population, mais la variance de la population multipliee par n1n . Bien s^ur, sinest tres grand, ces deux nombres seront tres proches l'un de l'autre.

8CHAPITRE 3. DISTRIBUTIONS D'ECHANTILLONNAGE

3.3.2 La variable aleatoireS2

Denition deS2

Pour pouvoir determiner une valeur approchee de2popet savoir quelle erreur on commet en eectuant cette approximation, on veut disposer d'une variable dont l'esperance est la variance de la population. Nous allons donc considerer une nouvelle variable aleatoireS2.

Denition 7

S

2=nn12ech=1n1n

X i=1(XiX)2:

On a bien entenduE(S2) =2pop.

Nous verrons plus tard que cela signie queS2est un estimateursans biais de2pop.

Distribution deS2

Nous supposons ici queXsuit une loi normale.

On considere la variableY=n2ech

2pop=nX

i=1(XiX pop)2. Yest une somme d'ecarts reduits relatifs a une variable normale. D'apres ce que nous avons vu au chapitre 3, paragraphe 7.1, nous pouvons armer queY suit une loi du2an1 degres de liberte (on perd un degre de liberte car on a estime le parametremparX).

Proposition 8Y=(n1)S2

2popsuit une loi2n1.

Remarque 9Encore une fois, on n'a pas directement la loi deS2mais celle de (n1)S2 2pop. Approximation de la distribution deS2dans le cas des grands echantillons : n30 Nous avons vu au chapitre 3 que lorsquenest grand (n30), on pouvait approcher la loi2par la loiN(;p2). DoncYsuit approximativement une loi normale,E(Y)'n1 etV ar(Y)'2(n1).

Proposition 10Sin30,S2suit une loiN(2pop;2popr2

n1), en premiere approximation. Preuve.La loi deS2est alors approximativement normale, son esperancequotesdbs_dbs47.pdfusesText_47