[PDF] [PDF] Estimations et intervalles de confiance - Institut de Mathématiques

mations : intervalle de confiance d'une proportion, d'une moyenne Un aspect important de l'inférence statistique consiste à obtenir des “esti- mations fiables" 



Previous PDF Next PDF





[PDF] Cours de statistique descriptive

statistique ❑ Il existe О La moyenne simple : calculée à partir d'un tableau élémentaire où (intervalle allant de la valeur minimum prise par le caractère X



[PDF] STATISTIQUE DESCRIPTIVE

évaluer une grandeur statistique comme la moyenne ou la variance (estimateurs, intervalles de confiance ) ⇒ savoir si deux populations sont comparables 



[PDF] Cours de Statistique Descriptive

La moyenne arithmétique (X) d'une série statistique est égale à la somme des On appelle Intervalle interquartile: la différence entre les valeurs du 3e et 1e



[PDF] Estimations et intervalles de confiance - Institut de Mathématiques

mations : intervalle de confiance d'une proportion, d'une moyenne Un aspect important de l'inférence statistique consiste à obtenir des “esti- mations fiables" 



[PDF] Calcul dun intervalle de confiance pour la moyenne dans une

Essai présenté `a la Faculté des études supérieures de l'Université Laval dans le cadre du programme de maˆıtrise en statistique pour l'obtention du grade de 



[PDF] Cours de Statistiques niveau L1-L2 - Archive ouverte HAL

7 mai 2018 · Applications des intervalles de confiance et tests statistiques 1 note de contrôle continu (CC) moyenne de CC1 et CC2 ▷ 1 note d'examen 



[PDF] Paramètres statistiques

On considère un caractère quantitatif continu X On note n l'effectif total Les modalités sont des intervalles Pour calculer la moyenne, on remplace ces



[PDF] Les statistiques

d'intervalle de confiance d'un paramètre statistique et appelle quelques remarques: représente le calcul de la moyenne d'un échantillon de n sujets 2 2



[PDF] Statistique inférentielle

IC moyenne IC proportion Plan 1 Introduction 2 Estimation ponctuelle 3 Estimation par intervalle 4 Intervalle de confiance d'une moyenne 5 Intervalle de  

[PDF] moyenne maths

[PDF] moyenne meaning

[PDF] moyenne médiane étendue quartiles

[PDF] moyenne minimum pour passer en 1ere es

[PDF] Moyenne mobile 1 et 2

[PDF] moyenne nationale bac 2015

[PDF] moyenne nationale bac 2016

[PDF] moyenne nationale bac anglais

[PDF] moyenne nationale bac francais

[PDF] moyenne nationale bac francais 2016

[PDF] moyenne nationale bac francais ecrit

[PDF] moyenne nationale bac maths

[PDF] moyenne nationale bac par matiere

[PDF] moyenne nationale bac par matiere 2016

[PDF] moyenne nationale bac philo

Estimations et intervalles de confiance

Estimations et intervalles de confiance

Résumé

Cette vignette introduit la notion d"estimateur et ses propriétés : ponctuelle de paramètres de loi : proportion, moyenne, variance. La connaissance des lois de ce estimateurs permet l"estimation par in- tervalle de confiance et donc de préciser l"incertitude sur ces esti- mations : intervalle de confiance d"une proportion, d"une moyenne si la variance est connue ou non, d"une variance.

Retour au

plan du cour s

1 Introduction

Le cadre est le suivant : on dispose de données observées (en nombre fini) et l"on désire tirer des conclusions de ces données sur l"ensemble de la popu- lation. On fait alors une hypothèse raisonnable : il existe une loi de probabilité sous-jacente telle que les "valeurs observables" des différents éléments de la population étudiée puissent être considérées comme des variables aléatoires indépendantes ayant cette loi. Un aspect important de l"inférence statistique consiste à obtenir des "esti- mations fiables" des caractéristiques d"une population de grande taille à partir d"un échantillon extrait de cette population. C"est un problème de décision concernant des paramètres qui le plus souvent sont : l"espérance mathématique ; la proportion p; la v ariance2. Ces paramètres sont a priori inconnus car la taille réelle de la population étant très grande, il serait trop coûteux de tester tous les éléments de la population. Ainsi, comme un échantillon ne peut donner qu"une information partielle sur la population, les estimations que l"on obtiendra seront inévitablement entachées d"erreurs qu"il s"agit d"évaluer et de minimiser autant que possible. En résumé, estimer un paramètre inconnu, c"est en donner une valeur ap-

prochée à partir des résultats obtenus sur un échantillon aléatoire extrait de lapopulation sous-jacente.

Exemple :Un semencier a récolté 5 tonnes de graines de Tournesol. Il a besoin de connaître le taux de germination de ces graines avant de les mettre en vente. Il extrait un échantillon de 40 graines, les dépose sur un buvard humide et compte le nombre de graines ayant évolué favorablement. On remarque que ce contrôle est de type destructif : l"échantillon ayant servi au contrôle ne peut plus être commercialisé. Il s"agit donc d"évaluer la proportionpdes graines de la population à grand effectif, présentant un certain caractèreX: succès de la germination. Même avec une population d"effectif restreint, un contrôle depne peut être calculée. Le modèle s"écrit commenréalisationsxide v.a.r. indépendantes de Ber- noulliXidéfinies par : X i=1si l"individuiprésente le caractèreX

0sinon.

Il est naturel d"estimerpparx

n=1n P n i=1xi;qui est la proportion des indi- vidus ayant le caractèreXdans l"échantillon. En effet, la LGN nous assure de la convergence en probabilité de la v.a.r.X=1n P n i=1Xivers l"espérance de X

1, c"est-à-direp;Xest l"estimateur de la proportionpetpest estimée par

la réalisationx ndeX. Dans l"expérience de germination, 36 graines ont eu une issue favorable avecxi= 1. La proportion estimée estx= 40=36 = 0;9 C"est une estimation diteponctuelle. D"autre part, dans toute discipline scien- tifique, il est important d"avoir une indication de la qualité d"un résultat ou encore de l"erreur dont elle peut-être affectée. Ceci se traduit en statistique par la recherche d"un intervalle, ditintervalle de confiance, dont on peut assurer, avec un risque d"erreur contrôlé et petit, que cet intervalle contient la "vraie" valeur inconnue du paramètre. Dans la suite nous nous intéresserons donc à deux types d"estimations : soit une estimation donnée par v aleurscalaire issue des réalisations des v.a.r.Xi: l"estimationponctuelle; soit une estimation donnée par un ensemble de v aleursappartenant à un intervalle : l"estimation parintervalle de confiancecontrôlé par un risque d"erreur fixéa priori.1

Estimations et intervalles de confiance

2 Estimation ponctuelle

2.1 Estimateur

Convergence

DÉFINITION1. - Unn-échantillon aléatoire issu d"une v.a.r.Xest un en- semble(X1;:::;Xn)denv.a.r. indépendantes et de même loi queX. Soitun paramètre associé à la loi deX, par exemple=E(X)ou= Var(X). À partir de l"observation d"un échantillon aléatoire(X1;:::;Xn), on souhaite estimer le paramètre. DÉFINITION2. - Un estimateurbndeest une fonction qui dépend unique- ment dun-échantillon(X1;:::;Xn). Il est dit convergent s"il est "proche" de au sens de la convergence en probabilité : pour tout >0, P jbnj> !n!+10:

Dans l"exemple de l"introduction, la quantité

1n P n i=1Xiest un estimateur convergent depet si, par exemple, on a observé21pièces défectueuses sur un lot de1500pièces prélevées, l"estimation ponctuelle depobtenue estx n= 21=1500 = 1;4%. Pour estimer l"espérancedes variables aléatoiresXi, on utilise la moyenne empiriqueX n=1n n X i=1X i; car par la LGN, on sait qu"elle converge en probabilité vers l"espérance =E(X1). Le but de la théorie de l"estimation est de choisir, parmi toutes les statistiques possibles, le "meilleur" estimateur convergent, c"est-à-dire celui qui donnera une estimation ponctuelle la plus proche possible du paramètre et ceci, quel

que soit l"échantillon.Exemple :Considérons une v.a.r.Xreprésentant le nombre de grippes attra-

de paramètre >0. Chercher la loi deX, c"est chercher, qui n"est autre que l"espérance mathématique deX. Par conséquent, la LGN nous indique queX n est un estimateur convergent de: pour tout >0, P 1n n X i=1X i n!+10: Grâce à l"inégalité de Chebychev, on peut démontrer le théorème suivant : THÉORÈME3. - Soitbnun estimateur de. Si l"on a : lim n!+1E(bn) =et limn!+1Var(bn) = 0; alors bnest un estimateur convergent de. Biais DÉFINITION4. - Soitbnun estimateur convergent d"un paramètre. On appelle biais la quantitéE(bn). L"estimateurbnest dit sans biais si

E(bn) =, et biaisé sinon.

Exemple :La moyenne empiriqueX

nest un estimateur convergent et sans biais de l"espérance mathématique.

Écart quadratique moyen

Notons que l"on a

E n (bn)2o =En (bnE(bn) +E(bn))2o =En (bnE(bn))2+ (E(bn))2+ 2(bnE(bn))(E(bn))o =Var(bn) + (biais)2; car le termeEn (bnE(bn))(E(bn))o est nul. Ainsi, pour rendre l"écart quadratique moyenEn (bn)2o le plus petit possible, il faut que2

Estimations et intervalles de confiance

-E(bn) =, donc choisir un estimateur sans biais, la v arianceV ar(bn)soit faible. On choisira donc, parmi les estimateurs convergents et sans biais, celui qui a la variance la plus petite. En d"autres termes, si bnest un estimateur convergent et sans biais de, on a tout intérêt à ce quebnne varie pas trop autour de sa

2.2 Estimateur d"une moyenne ou d"une proportion

On considère unn-échantillon(X1;:::;Xn)issu d"une loi de moyenne et de variance2, toutes deux inconnues. 1. d"après la LGN, la mo yenneempirique X nest un estimateur convergent de. 2. l"estimateur X nest sans biais. 3. par indépendance : V ar(X n) =2n 4. loi de X n: si X N(;2), alorsX n N(;2=n). lorsque nest grand, d"après le TCL, la loi deX nest approchée par une loi normaleN(;2=n). L"estimation d"une proportionpest un cas particulier du précédent, au sens où les v.a.r.Xiconsidérées sont de Bernoulli de paramètrep.

2.3 Estimateur de la variance

DÉFINITION5. - La variance empirique associée à unn-échantillon (X1;:::;Xn)est définie par S

2n=1n1n

X i=1(XiX n)2: DÉFINITION6. - Soit(Y1;:::;Yn)unn-échantillon de v.a.r. de loiN(0;1). On appelle loi du chi-deux àndegrés de liberté la loi de la v.a.r.Pn i=1Y2i, et on la note2(n).

Propriétés de la variance empirique :

1.S2nest un estimateur convergent de la variance2.2.S2nest sans biais.

3. loi de S2n: pas de résultat général. Cependant, siX N(;2), alors la v.a.r. n1

2S2nsuit une loi du chi-deux àn1degrés de libertés2(n1):

Remarque :PuisqueE(Yi) = 0;on aE(Y2i) =Var(Yi) = 1. SiVsuit une loi

2(n), alors

E(V) =E(Y21+:::+Y2n) =n:

Ainsi on retrouve le fait queS2nest un estimateur convergent et sans biais de 2:

E(S2n) =2n1E(2n1) =2:

3 Estimation par intervalle de confiance

Pour l"estimation ponctuelle, on considère

un paramètre inconnu , un ensemble de v aleursobservées (x1;:::;xn), réalisations d"unn- échantillon aléatoire(X1;:::;Xn), et son estimation ponctuellex n= 1n P n i=1xi. Les estimations ponctuelles n"apportent pas d"information sur la précision des résultats, c"est-à-dire qu"elles ne tiennent pas compte des erreurs dues aux fluc- tuations d"échantillonnage. Pour évaluer la confiance que l"on peut avoir en une valeur, il est nécessaire de déterminer un intervalle contenant, avec une certaine probabilité fixée au préalable, la vraie valeur du paramètre : c"est l"es- timation par intervalle de confiance.

3.1 Définition d"un intervalle de confiance

Soit(X1;:::;Xn)unn-échantillon aléatoire etun paramètre inconnu de la loi desXi. DÉFINITION7. - Soit2]0;1[. S"il existe des v.a.r.min(X1;:::;Xn)et max(X1;:::;Xn)telles que P

2[min(X1;:::;Xn);max(X1;:::;Xn)]= 1;

on dit alors que[min(X1;:::;Xn);max(X1;:::;Xn)]est un intervalle de confiance pour, avec coefficient de sécurité1:On le noteIC1().3

Estimations et intervalles de confiance

Dans la pratique, on peut prendre par exemple= 5%, ce qui nous donne un IC à95%. Cela signifie qu"il y a95%de chance que la valeur inconnuesoit comprise entremin(x1;:::;xn)etmax(x1;:::;xn).

3.2 Intervalle de confiance pour la moyenne et la va-

riance dans le cas d"un échantillon gaussien Soit(X1;:::;Xn)unn-échantillon de v.a.r. de loiN(;2). Estimation de l"espérancelorsque la variance2est connue

Pour estimer, on utilise la moyenne empiriqueX

n=1n P n i=1Xiqui a pour loiN(;2=n). Il en résulte que pn X n N(0;1); et que P z1=2pn X n z1=2 = 1:

Ceci équivaut à

P X nz1=2pn X n+z1=2pn = 1: On obtient donc un IC pour l"espéranceavec coefficient de sécurité1 dans le cas oùest connu : il s"agit de l"intervalle aléatoire X nz1=2pn ;X n+z1=2pn

Ainsi, dans les calculs, l"IC est donné par

IC

1() =x

nz1=2pn ;x n+z1=2pn oùx nest l"estimation ponctuelle deassociée à la réalisation dun-échantillon (X1;:::;Xn).Estimation de l"espérancelorsque la variance2est inconnue Lorsque la variance2est inconnue, il est alors nécessaire de remplacer dans les formules précédentes cette quantité par la variance empirique, qui en est un estimateur convergent. Il faut donc considérer non plus la quantitépn X n mais plutôt pn X nS n qui ne suit plus une loi normale mais une loi dite de Student àn1degrés de liberté, que l"on noteTn1. La densité de la loi de Student est une fonction paire, comme la loi normaleN(0;1). On dispose de tables pour obtenir les quantiles de cette loi. On en déduit donc que P t1=2pn X nS n t1=2 = 1; ce qui équivaut à P X nt1=2S npn X n+t1=2S npn = 1: On obtient donc un IC pouravec coefficient de sécurité1, dans le cas où la variance2est inconnue : il s"agit de l"intervalle aléatoire X nt1=2S npn ;X n+t1=2S npn

Ainsi, dans les calculs, l"IC est donné par

IC

1() =x

nt1=2s npn ;x n+t1=2s npn oùx nets2nsont les estimations ponctuelles respectives de la moyenneet de la variance2. Remarque :Si les v.a.r.X1;:::;Xnne sont pas gaussiennes mais quenest assez grand (en pratique supérieur à 30), alors le TCL nous garantit que laquotesdbs_dbs47.pdfusesText_47