[PDF] Chapitre 3 - Distributions déchantillonnage





Previous PDF Next PDF



LES BIAIS EN EPIDEMIOLOGIE.pdf

on peut extrapoler les résultats: Erreurs dues au hasard (fluctuation d'échantillonnage) La population dont est extrait l'échantillon d'étude.



EchantillonnageV5b-short [Mode de compatibilité]

9 oct. 2013 partie (échantillon) de la population étudiée. ?plusieurs échantillons peuvent être constitués. ... ? ou fluctuation d'échantillonnage.



Méthode déchantillonnage dans les études épidémiologiques

18 oct. 2021 Unité de recherche Aide à la décision pour une médecine ... limitation des fluctuations d'échantillonnage induite par les quotas permet de ...



LES TESTS DHYPOTHÈSE

Cet écart est imputable aux fluctuations d'échantillonnage. On accepte H0 . 2.2. TESTS SUR UNE PROPORTION. Nous nous proposons de tester si la proportion p d' 



Enseignement scientifique

questions relatives à la biologie la médecine



Intervalle de fluctuation Intervalle de confiance

On utilise un intervalle de fluctuation lorsque la proportion sur sa valeur (prise de décision à partir d'un échantillon). La.



Calcul du nombre de sujets nécessaires

4 avr. 2019 Du fait des fluctuations d'échantillonnage chaque échantillon donne cependant une observation différente a priori. • Plus les échantillons ...



Chapitre 3 - Distributions déchantillonnage

En déterminant les lois de probabilités qui régissent ces fluctuations. C'est l'objet de ce chapitre. Page 3. 3.2. LA VARIABLE ALÉATOIRE : MOYENNE 



ESTIMATION DE PARAMÈTRES

Mais même tiré au sort



6 - Notions de base en statistique.pdf

échantillon futur < fluctuations d'échantillonnage Valeur observée sur un échantillon : Estimation ponctuelle p ... Médecine - Biologie.



Fluctuation déchantillonnage et Intervalle de confiance - SFMU

On veut maintenant savoir si la moyenne calculée sur un échantillon est proche ou non de la moyenne de la population totale Il existe pour cela une méthode 



[PDF] FLUCTUATION DÉCHANTILLONNAGE - Mathématiques

Grâce à un tableur on va simuler les résultats de calculs de pourcentages dans des échantillons extraits d'une population dont on connaît la composition



[PDF] FLUCTUATION ET ESTIMATION - maths et tiques

Avec l'anglais Egon Pearson il développe la théorie de l'estimation et de la prise de décision sur un échantillon Ses travaux trouveront rapidement des 



[PDF] Cours de Statistiques inférentielles

Nous allons étudier comment se comporte un échantillon (éléments pris au hasard) dans une population dont on connaît les caractéristiques statistiques (lois ) 



[PDF] Échantillonnage - UFR Santé - Université de Franche-Comté

9 oct 2013 · Échantillonnage (ou sondage) : – procédé qui consiste à n'observer qu'une partie (échantillon) de la population étudiée ?plusieurs 



[PDF] Médecine factuelle : une introduction à la statistique - DIVAT

Médecine factuelle Concept EBM L'échantillonnage Les fluctuations d'échantillonnage Les variables aléatoires Définitions Loi de probabilité



[PDF] Méthode déchantillonnage dans les études épidémiologiques

18 oct 2021 · Unité de recherche Aide à la décision pour une médecine limitation des fluctuations d'échantillonnage induite par les quotas permet de 



[PDF] Estimation dun effectif par échantillonnage - Eduscol

La présentation de la méthode de CMR permet de sensibiliser les élèves à la fluctuation d'échantillonnage et à la notion d'intervalle de confiance dans le cadre 



[PDF] Théorie de lestimation

Cette estimation nécessite de savoir comment fluctue une moyenne observée sur un échantillon 1 Fluctuation d'échantillonnage d'une moyenne: µ inconnue

  • C'est quoi la fluctuation d'échantillonnage ?

    Lorsque l'on étudie un caractère sur plusieurs échantillons de même taille d'une même population, on peut observer que les résultats ne sont pas identiques selon les échantillons ; ce phénomène s'appelle fluctuation d'échantillonnage.
  • Quand utiliser intervalle de confiance ou fluctuation ?

    c'est que l'intervalle de fluctuation on utilise lorsqu'on connaît la proportion p alors soit on la connaît. soit on est capable d'en faire l'hypothèse en tout cas on peut écrire au départ de l'exercice p égal temps alors que l'intervalle de confiance lui.
  • Comment calculer l'intervalle de fluctuation ?

    L'intervalle de fluctuation asymptotique au seuil de 95 % pour une variable aléatoire X n X_n Xn suivant une loi binomiale B ( n , p ) B(n,p) B(n,p) est l'intervalle : I n = [ p ? 1 , 96 p ( 1 ? p ) n ; p + 1 , 96 p ( 1 ? p ) n ] I_n = \\left[p-1,96\\dfrac{\\sqrt{p(1-p)}}{\\sqrt{n}};p+1,96\\dfrac{\\sqrt{p(1-p)}}{\\sqrt{n}} \\
  • IV La statistique inférentielle. Son but est d'étendre (d'inférer) les propriétés constatées sur l'échantillon (gr? l'analyse exploratoire par exemple) `a la population toute enti`ere, et de valider ou d'infirmer des hypoth`eses.

Chapitre 3

Distributions

d'echantillonnage

3.1 Generalites sur la notion d'echantillonnage

3.1.1 Population et echantillon

On appelle population la totalite des unites de n'importe quel genre prises en consideration par le statisticien. Elle peut ^etre nie ou innie. Un echantillon est un sous-ensemble de la population etudiee. Qu'il traite un echantillon ou une population, le statisticien decrit habi- tuellement ces ensembles a l'aide de mesures telles que le nombre d'unites, la moyenne, l'ecart-type et le pourcentage. | Les mesures que l'on utilise pour decrire une population sont des pa- rametres. Un parametre est une caracteristique de la population. | Les mesures que l'on utilise pour decrire un echantillon sont appelees des statistiques. Une statistique est une caracteristique de l'echantillon. Nous allons voir dans ce chapitre et dans le suivant comment les resultats obtenus sur un echantillon peuvent ^etre utilises pour decrire la population. On verra en particulier que les statistiques sont utilisees pour estimer les parametres. An de ne pas confondre les statistiques et les parametres, on utilise des notations dierentes, comme le presente le tableau recapitulatif suivant. 1

2CHAPITRE 3. DISTRIBUTIONS D'ECHANTILLONNAGEPOPULATION

ECHANTILLOND

EFINITIONC'est l'ensemble des unitesC'est un sous-ensemble de la considerees par le statisticien.population choisie pour etude.

CARACT

ERISTIQUESCe sont les parametresCe sont les statistiques NOTATIONSN = taille de la populationn = taille de l'echantillon (si elle est nie) Si on etudie unmoyenne de la populationmoyenne de l'echantillon caractere quantitatifm=1N P N i=1xix=1n P n i=1xiecart-type de la populationecart-type de l'echantillon pop=q1 N P N i=1(xim)2 ech=q1 n P n i=1(xix)2Si on etudie unproportion dans la populationproportion dans l'echantillon caractere qualitatifpf

3.1.2 L'echantillonage

Avantages de l'echantillonnage

| Co^ut moindre. | Gain de temps. | C'est la seule methode qui donne des resultats dans le cas d'un test destructif.

Methodes d'echantillonnage

Echantillonnage sur la base du jugement (par exemple, dans les cam- pagnes electorales certains districts electoraux sont des indicateurs ables de l'opinion publique). |Echantillonnage aleatoire simple. Tous les echantillons possibles de m^eme taille ont la m^eme probabilite d'^etre choisis et tous les elements de la population ont une chance egale de faire partie de l'echantillon (On utilise souvent une table de nombres aleatoires pour s'assurer que le choix des elements s'eectue vraiment au hasard). Remarque 1Il existe deux autres methodes d'echantillonnage aleatoire mais elles ne nous interessent pas ici . Ce sont l'echantillonnage stratie et l'echantil- lonnage par grappes. Bien entendu, seul l'echantillonnage aleatoire nous permettra de juger objective- ment de la valeur des estimations faites sur les caracteristiques de la population.

Inconvenient de l'echantillonnage

L'echantillonnage a pour but de fournir susamment d'informations pour pouvoir faire des deductions sur les caracteristiques de la population. Mais bien entendu, les resultats obtenus d'un echantillon a l'autre vont ^etre en general dierents et dierents egalement de la valeur de la caracteristique correspon- dante dans la population. On dit qu'il y a des uctuations d'echantillonnage. Comment, dans ce cas, peut-on tirer des conclusions valables? En determinant les lois de probabilites qui regissent ces uctuations. C'est l'objet de ce chapitre.

3.2. LA VARIABLE AL

EATOIRE : MOYENNE D'ECHANTILLON3

3.2 La variable aleatoire : moyenne d'echantillon

3.2.1 Introduction

Position du probleme :

Si nous prelevons un echantillon de taillendans une population donnee, la moyenne de l'echantillon nous donnera une idee approximative de la moyenne de la population. Seulement si nous prelevons un autre echantillon de m^eme taille, nous obtiendrons une autre moyenne d'echantillon. Sur l'ensemble des echantillons possibles, on constatera que certains ont une moyenne proche de la moyenne de la population et que d'autres ont une moyenne qui s'en ecarte davantage.

Comment traiter le probleme?

Un echantillon de taillen(appele aussi unn-echantillon), obtenu par echan- tillonnage aleatoire, va ^etre considere comme le resultat d'une experience aleatoi- re. A chaque echantillon de taillenon peut associer la valeur moyenne des elements de l'echantillon. On a donc deni une variable aleatoire qui a chaque n-echantillon associe sa moyenne echantillonnale. On la noteX. Cette variable aleatoire possede bien entendu : | Une distribution de probabilite. | Une valeur moyenne (la moyenne des moyennes d'echantillons, vous sui- vez toujours?). | Un ecart-type. Le but de ce paragraphe est de determiner ces trois elements. Avant de continuer, essayons de comprendre sur un exemple ce qui se passe. Exemple 2Une population est constituee de 5 etudiants en statistique (le faible eectif n'est pas d^u a un manque d'inter^et pour la matiere de la part des etudiants mais au desir de ne pas multiplier inutilement les calculs qui vont suivre! ). Leur professeur s'interesse au temps hebdomadaire consacre a l'etude des statistiques par chaque etudiant.

On a obtenu les resultats suivants.

EtudiantTemps d'etude (en heures)

A7 B3 C6 D10 E4

Total30

La moyenne de la population estm= 30=5 = 6.

Si le professeur choisit un echantillon de taille 3, quelles sont les dierentes valeurs possibles pour la moyenne de son echantillon? Quelle relation existe-t-il entre cette moyenne d'echantillon et la veritable moyenne 6 de la population? Toutes les possibilites sont regroupees dans le tableau ci-dessous.

4CHAPITRE 3. DISTRIBUTIONS D'ECHANTILLONNAGENumero de

EchantillonValeurs du temps d'etudeMoyennes de

l'echantillondans cet echantillonl' echantillon

1A, B, C7,3,65.33

2A, B, D7,3,106.67

3A, B, E7,3,44.67

4A, C, D7,6,107.67

5A, C, E7,6,45.67

6A, D, E7,10,47.00

7B, C, D3,6,106.33

8B, C, E3,6,44.33

9B, D, E3,10,45.67

10C, D, E6,10,46.67

Total60.00

On constate que :

| Il y a 10 echantillons (C35= 10). | La moyenne des echantillons varie entre 4.33 et 7.67, ce qui signie que la distribution des moyennes d'echantillon est moins dispersee que la distribution des temps d'etude des etudiants, situee entre 3 et 10. | Il est possible que deux echantillons aient la m^eme moyenne. Dans cet exemple, aucun n'a la moyenne de la population (m= 6). | La moyenne des moyennes d'echantillon estE(X) = 60=10 = 6. En fait, nous allons voir que le fait que l'esperance deX(c'est-a-dire la moyenne des moyennes d'echantillon ) est egale a la moyenne de la population n'est pas verie seulement dans notre exemple. C'est une loi generale. Bien, me direz-vous, mais pourquoi faire tout cela? Dans la realite, on ne choisit qu'un seul echantillon. Alors comment le professeur de statistique qui ne conna^t qu'une seule moyenne d'echantillon pourra-t-il deduire quelque chose sur la moyenne de la population? Tout simplement en examinant \jusqu'a quel point" la moyenne d'un echantillon unique s'approche de la moyenne de la po-

pulation. Pour cela, il lui faut la distribution theorique de la variable aleatoireXainsi que l'ecart-type de cette distribution.

3.2.2 Etude de la variable : moyenne d'echantillon

Denition de la variable

On considere une population dont les elements possedent un caractere me- surable qui est la realisation d'une variable aleatoireXqui suit une loi de probabilite d'esperancemet d'ecart-typepop. On suppose que la population est innie ou si elle est nie que l'echantillonnage se fait avec remise. | On preleve un echantillon aleatoire de taillenet on mesure les valeurs de Xsur chaque element de l'echantillon. On obtient une suite de valeurs x

1;x2;:::;xn.

| Si on preleve un deuxieme echantillon toujours de taillen, la suite des valeurs obtenues estx01;x02;:::;x0n, puisx001;x002;:::;x00n... etc... pour des echantillons supplementaires. x

1,x01,x001,... peuvent ^etre considerees comme les valeurs d'une variable

aleatoireX1qui suit la loi deX. De m^eme,x2,x02,x002,... peuvent ^etre considerees comme les valeurs d'une variable aleatoireX2qui suit aussi la loi deX, ... et

3.2. LA VARIABLE AL

EATOIRE : MOYENNE D'ECHANTILLON5

x n,x0n,x00n,... celles d'une variable aleatoireXnqui suit encore et toujours la m^eme loi, celle deX. |X1pourrait se nommer \valeur du premier element d'un echantillon". X

2pourrait se nommer \valeur du deuxieme element d'un echantillon".

....Xnpourrait se nommer \valeur dun-ieme element d'un echantillon". | L'hypothese d'une population innie ou d'un echantillonnage avec remise nous permet d'armer que cesnvariables aleatoires sont independantes. Rappel sur les notations : Par convention, on note toujours les variables aleatoires a l'aide de lettres majuscules (Xi) et les valeurs qu'elles prennent dans une realisation a l'aide de lettres minuscules (xi). Si les valeurs prises parXdans unechantillon sontx1;x2;:::;xn, la moyenne xde l'echantillon est donnee par x=1n (x1++xn) =1n n X i=1x i. Cette valeur n'est rien d'autre que la valeur prise dans cet echantillon de la variable aleatoire 1n (X1++Xn) =1n n X i=1X i. Denition 3On denit donc lavariable aleatoiremoyenne d'echantillonX par X=1n (X1++Xn) =1n n X i=1X i:

Parametres descriptifs de la distribution

On applique les proprietes de l'esperance et de la variance etudiees au cha- pitre 2. |E(X) =1n P n i=1E(Xi) =nmn =m, car les variables suivent toutes la m^eme loi d'esperancem. |V ar(X) =1n 2Pn i=1V ar(Xi) =n2 popn 2=2 popn , car les variables suivent toutes la m^eme loi de variance et sont independantes.

Proposition 4

E(X) =m; V ar(X) =2popn

Remarque 51. Nous venons de demontrer ce que nous avions constate sur notre exemple : la moyenne de la distribution d'echantillonnage des moyennes est egale a la moyenne de la population.

2. On constate que plusncro^t, plusV ar(X)decro^t.

Dans l'exemple d'introduction, nous avions en eet constate que la distribution des moyennes d'echantillon etait moins dispersee que la distribution initiale. En eet, a mesure que la taille de l'echantillon augmente, nous avons acces a une plus grande quantite d'informations pour estimer la moyenne de la popula- tion. Par consequent, la dierence probable entre la vraie valeur de la moyenne de la population et la moyenne echantillonnale diminue. L'etendue des valeurs possibles de la moyenne echantillonnale diminue et le degre de dispersion de la distribution aussi.(X) est aussi appele l'erreur-typede la moyenne.

6CHAPITRE 3. DISTRIBUTIONS D'ECHANTILLONNAGE

On peut schematiser le passage de la distribution de la variable aleatoireX a celle de la variable aleatoireXen passant par les dierents echantillons par le graphique ci-apres.la distribution x /(01*2,32 $4+33*((2,32 5 m -6 6 .6 pop .+82,,2#$2#!"#7+7*!"'%+,

03"('!type de la population

9"!2*(&#$2&#*,%'0&#$2#!"#7+7*!"'%+,

/(01*2,32 $4+33*((2,32 5

6#03"('!type de la distribution de l'échantillon

6#9"!2*(&#$2&#*,%'0&#$2#!403>",'%!!+,-

ech /(01*2,32 $4+33*((2,32 5 ?"#$%&'(%)*'%+,#$2 !"#7+7*!"'%+, @+*(,%'#!2&#$+,,02&

7+*(#0'")!%(

$+,,02&

03>",'%!!+,,"!2&

pop,6 6

03"('!type de la distribution d'échantillonnage des moyennes

$%@@0(2,'2& $403>",'%!!+,&

7+*(#0'")!%(

@+*(,%&&2,'#!2& $2&#.+82,,2& $403>",'%!!+,,"A2Mais conna^tre les parametres descriptifs de la distribution de

Xne sut

pas. Il faut conna^tre aussi sa distribution de probabilite. On se demande alors : depend elle

1. de la distribution deX?

2. de la taillende l'echantillon?

3.3. LA VARIABLE AL

EATOIRE : VARIANCE D'ECHANTILLON7

3.3 La variable aleatoire : variance d'echantillon

La variance2ech=1n

n X i=1(xix)2d'unn-echantillon est la realisation de la variable aleatoire

2ech=1n

n X i=1(XiX)2. On peut se demander si cette variable possede la m^eme propriete que la variable moyenne d'echantillon, c'est-a-dire si l'esperance de

2echest egale a la variance de la population.

3.3.1 Esperance de la variable aleatoire2ech

Autre expression de2ech

2ech=1n

n X i=1(XiX)2 1n n X i=1(Xim+mX)2 1n n X i=1(Xim)2+2n n X i=1(Xim)(mX) +1n n X i=1(mX)2 =A+B+C;

Or,B=2n

(mX)nX i=1(Xim) =2(mX)2etC= (mX)2. On en deduit que

2ech=1n

n X i=1(Xim)2(Xm)2:

Esperance de2ech

Proposition 6

E(2ech) =n1n

2pop:

Preuve.

E(2ech) =1n

n X i=1E((Xim)2)E((Xm)2) 1n n X i=1V ar(Xi)V ar(X) =2pop1n

2pop=n1n

2pop: Conclusion. La moyenne des variances d'echantillon n'est pas la variance de la population, mais la variance de la population multipliee par n1n . Bien s^ur, sinest tres grand, ces deux nombres seront tres proches l'un de l'autre.

8CHAPITRE 3. DISTRIBUTIONS D'ECHANTILLONNAGE

3.3.2 La variable aleatoireS2

Denition deS2

Pour pouvoir determiner une valeur approchee de2popet savoir quelle erreur on commet en eectuant cette approximation, on veut disposer d'une variable dont l'esperance est la variance de la population. Nous allons donc considerer une nouvelle variable aleatoireS2.

Denition 7

S

2=nn12ech=1n1n

X i=1(XiX)2:

On a bien entenduE(S2) =2pop.

Nous verrons plus tard que cela signie queS2est un estimateursans biais de2pop.

Distribution deS2

Nous supposons ici queXsuit une loi normale.

On considere la variableY=n2ech

2pop=nX

i=1(XiX pop)2. Yest une somme d'ecarts reduits relatifs a une variable normale. D'apres ce que nous avons vu au chapitre 3, paragraphe 7.1, nous pouvons armer queY suit une loi du2an1 degres de liberte (on perd un degre de liberte car on a estime le parametremparX).

Proposition 8Y=(n1)S2

2popsuit une loi2n1.

Remarque 9Encore une fois, on n'a pas directement la loi deS2mais celle de (n1)S2 2pop. Approximation de la distribution deS2dans le cas des grands echantillons : n30 Nous avons vu au chapitre 3 que lorsquenest grand (n30), on pouvait approcher la loi2par la loiN(;p2). DoncYsuit approximativement une loi normale,E(Y)'n1 etV ar(Y)'2(n1).

Proposition 10Sin30,S2suit une loiN(2pop;2popr2

n1), en premiere approximation. Preuve.La loi deS2est alors approximativement normale, son esperance vaut2popet sa variance approximativement V ar(S2) =V ar(2popn1Y) =4pop(n1)2V ar(Y)'24popn1:

3.4. DISTRIBUTION DE LA MOYENNE D'

ECHANTILLON9

3.4 Distribution de la moyenne d'echantillon

Nous allons distinguer deux cas : celui des grands echantillons (n30) et celui des petits echantillons (n <30).

3.4.1 Cas des grands echantillons :n30.

On peut appliquer le theoreme centrale-limite.

1. Nous sommes en presence denvariables aleatoires independantes.

2. Elles suivent la m^eme loi d'esperancemet de variance2pop, donc aucune

n'est preponderante. Conclusion.Lorsquendevient tres grand, la distribution deS=X1++ X nse rapproche de celle de la loi normale d'esperancenmet de variancen2pop,

Ssuit approximativementN(nm;n2pop).

Par consequent, pournassez grand, la distribution deX=S=nse rap- proche de celle de la loi normale d'esperancemet de variance2pop=nc'est-a-dire

N(m;poppn

). On peut donc considerer queXm pop=pn suit la loiN(0;1). Proposition 11Sin30,Xsuit approximativementN(m;poppn Remarque 12| En pratique, on considere que cela est vrai a partir de n30et que lorsque la forme de la distribution deXest pratiquement symetrique,n15est convenable. | Ce theoreme est tres puissant car il n'impose aucune restriction sur la distribution deXdans la population. | Si la variance est inconnue, un grand echantillon (n30) permet de deduire une valeur able pour2popen calculant la variance de l'echantillon

2echet en posant

2pop=nn12ech=1n1n

X i=1(xix)2; comme on l'a vu au paragraphe precedent.

3.4.2 Cas des petits echantillons :n <30

Nous nous placons alors exclusivement dans le cas ouXsuit une loi normale dans la population. Nous allons encore distinguer deux cas : celui oupopest connu et celui ou popest inconnu.

Cas oupopest connu

Xsuit une loi normaleN(m;pop) donc les variablesXisuivent toutes la m^eme loiN(m;pop). De plus elles sont independantes. D'apres la propriete vue au chapitre 3 sur la somme de lois normales independantes,S=X1++Xn a une distribution normale et la variableX=S=nsuit aussi une loi normale, la loiN(m;poppn ). DoncXm pop=pn suit la loiN(0;1).

10CHAPITRE 3. DISTRIBUTIONS D'ECHANTILLONNAGESi

n <30 popconnu,XsuitN(m;poppn ).Cas oupopest inconnu Lorsque l'echantillonnage s'eectue a partir d'une population normale de variance inconnue et que la taille de l'echantillon est petite (n <30), l'estimation de la variance eectuee au paragraphe precedent n'est plus able. On ne peut plus ecrire2pop'nn12echcar2echvarie trop d'echantillon en echantillon.

L'ecart-type de la distribution de

Xn'est donc plus une constantepoppn

connue approximativement gr^ace apoppn 'echpn1. On va alors considerer que l'ecart-type de Xsera donne dans chaque echantillon par une valeur dierente de echpn1. Nous devons donc considererechcomme la realisation d'une variable aleatoire, la variable ecart-type d'echantillon, notee echet denie par 2ech=1n n Xquotesdbs_dbs35.pdfusesText_40
[PDF] fluctuation d'échantillonnage cours

[PDF] biais d'indication

[PDF] stratification lca

[PDF] biais d'incorporation

[PDF] hypothèse du biais maximum

[PDF] biais lca

[PDF] glossaire lca anglais

[PDF] principe d'ambivalence lca

[PDF] critère de jugement censuré

[PDF] 500 exercices de phonétique pdf

[PDF] discrimination auditive exercices

[PDF] livre de phonétique française pdf

[PDF] la prononciation en classe

[PDF] fluctuations économiques définition

[PDF] quels sont les déterminants des fluctuations économiques