[PDF] Estimations et intervalles de confiance Exemple



Previous PDF Next PDF







Intervalle de confiance: à quoi ça sert - HUG

L’intervalle de confiance à 95 va de 8 7 à 23 6: les données de l’échantillon permettent de dire que, en réalité, l’effet du tai chi peut être 8 7 ou 23 6 L’intervalle de confiance à 95 ne contient pas la valeur 8 1 (la plus petite différence cliniquement pertinente): les données de l’échantillon permettent



Chapitre 19 : Intervalle de confiance : pour estimer une

intervalle de confiance de ???? au niveau de confiance 95 (mais il est impossible à justifier en TS et ne sera pas utilisé ) Exemple : On dispose d’une urne contenant un très grand nombre de boules rouges et bleues On ignore quelle est la proportion p de boules rouges dans l’urne, et rien ne permet de faire une hypothèse



MODULE 2 : Estimation par intervalle de confiance

• [c1,c 2] ou [g1(θˆ), g2(θˆ)] est appelé intervalle de confiance, • c1,c 2 sont les limites de confiance, • 1− α: degré de confiance ou degré de certitude Le principe de l’estimation par intervalle de confiance est de proposer un encadrement d’un paramètre inconnu d’une population dont la loi, elle, est connue



Intervalle de confiance d’une moyenne

IV- Signification de l’intervalle de confiance d’une moyenne L’intervalle de confiance à 95 d’une moyenne μ nous indique les bornes entre lesquelles on estime sa position On connait pas avec exactitude sa vraie valeur, mais on peut dire qu’elle a 95 chance sur 100 d’être comprise dans cet intervalle



Estimation d’un intervalle de confiance 1 - CAB INNOVATION

Intervalle de confiance de la variance d'une population gaussienne de moyenne inconnue Intervalle à 3 sigma à 60 de confiance : σ 3σ Variance • Cas c : intervalle de confiance approximatif L'intervalle de confiance est dit approximatif s’il se base sur l’approximation d’une loi par une autre



6 Estimation et intervalle de confiance - Fabrice Monna

Intervalle de confiance à 95 : n s X s X 1 96 * ; 1 96 * 95 = niveau de confiance Exercice : Quel intervalle si niveau de confiance = 99 ? Par exemple, imaginons l'intervalle de confiance à 95 de la moyenne suivant : [120 ; 140] La probabilité que cet intervalle contienne la valeur de µ est de 0,95 Autrement dit, en affirmant que la



Estimations et intervalles de confiance Exemple

ponctuelle de paramètres de loi : proportion, moyenne, variance La connaissance des lois de ce estimateurs permet l’estimation par in-tervalle de confiance et donc de préciser l’incertitude sur ces esti-mations : intervalle de confiance d’une proportion, d’une moyenne si la variance est connue ou non, d’une variance



CORRIGE des exercices sur les intervalles de confiance

Un institut de sondage communique à un candidat aux élections régionales l’intervalle de confiance au niveau 0,95 de son futur score Cet intervalle a une amplitude de 0,04 Combien de personnes a interrogé l’institut de sondage ? CORRIGE: a) La proportion de visiteurs français est INCONNUE L'effectif de l'échantillon est n

[PDF] intervalle de confiance d'une moyenne

[PDF] intervalle de confiance loi normale centrée réduite

[PDF] intervalle de confiance student

[PDF] intervalle de confiance d'une moyenne excel

[PDF] unité commerciale définition

[PDF] climat définition cycle 3

[PDF] definition de meteorologie

[PDF] unité commerciale physique et virtuelle complémentaire

[PDF] definition meteo

[PDF] dispense cap petite enfance

[PDF] deaes

[PDF] formule variance

[PDF] problème du second degré seconde

[PDF] bpjeps

[PDF] moyenne nationale bac francais 2017

Estimations et intervalles de confiance

Estimations et intervalles de confiance

Résumé

Cette vignette introduit la notion d"estimateur et ses propriétés : ponctuelle de paramètres de loi : proportion, moyenne, variance. La connaissance des lois de ce estimateurs permet l"estimation par in- tervalle de confiance et donc de préciser l"incertitude sur ces esti- mations : intervalle de confiance d"une proportion, d"une moyenne si la variance est connue ou non, d"une variance.

Retour au

plan du cour s

1 Introduction

Le cadre est le suivant : on dispose de données observées (en nombre fini) et l"on désire tirer des conclusions de ces données sur l"ensemble de la popu- lation. On fait alors une hypothèse raisonnable : il existe une loi de probabilité sous-jacente telle que les "valeurs observables" des différents éléments de la population étudiée puissent être considérées comme des variables aléatoires indépendantes ayant cette loi. Un aspect important de l"inférence statistique consiste à obtenir des "esti- mations fiables" des caractéristiques d"une population de grande taille à partir d"un échantillon extrait de cette population. C"est un problème de décision concernant des paramètres qui le plus souvent sont : l"espérance mathématique ; la proportion p; la v ariance2. Ces paramètres sont a priori inconnus car la taille réelle de la population étant très grande, il serait trop coûteux de tester tous les éléments de la population. Ainsi, comme un échantillon ne peut donner qu"une information partielle sur la population, les estimations que l"on obtiendra seront inévitablement entachées d"erreurs qu"il s"agit d"évaluer et de minimiser autant que possible. En résumé, estimer un paramètre inconnu, c"est en donner une valeur ap-

prochée à partir des résultats obtenus sur un échantillon aléatoire extrait de lapopulation sous-jacente.

Exemple :Un semencier a récolté 5 tonnes de graines de Tournesol. Il a besoin de connaître le taux de germination de ces graines avant de les mettre en vente. Il extrait un échantillon de 40 graines, les dépose sur un buvard humide et compte le nombre de graines ayant évolué favorablement. On remarque que ce contrôle est de type destructif : l"échantillon ayant servi au contrôle ne peut plus être commercialisé. Il s"agit donc d"évaluer la proportionpdes graines de la population à grand effectif, présentant un certain caractèreX: succès de la germination. Même avec une population d"effectif restreint, un contrôle depne peut être calculée. Le modèle s"écrit commenréalisationsxide v.a.r. indépendantes de Ber- noulliXidéfinies par : X i=1si l"individuiprésente le caractèreX

0sinon.

Il est naturel d"estimerpparx

n=1n P n i=1xi;qui est la proportion des indi- vidus ayant le caractèreXdans l"échantillon. En effet, la LGN nous assure de la convergence en probabilité de la v.a.r.X=1n P n i=1Xivers l"espérance de X

1, c"est-à-direp;Xest l"estimateur de la proportionpetpest estimée par

la réalisationx ndeX. Dans l"expérience de germination, 36 graines ont eu une issue favorable avecxi= 1. La proportion estimée estx= 40=36 = 0;9 C"est une estimation diteponctuelle. D"autre part, dans toute discipline scien- tifique, il est important d"avoir une indication de la qualité d"un résultat ou encore de l"erreur dont elle peut-être affectée. Ceci se traduit en statistique par la recherche d"un intervalle, ditintervalle de confiance, dont on peut assurer, avec un risque d"erreur contrôlé et petit, que cet intervalle contient la "vraie" valeur inconnue du paramètre. Dans la suite nous nous intéresserons donc à deux types d"estimations : soit une estimation donnée par v aleurscalaire issue des réalisations des v.a.r.Xi: l"estimationponctuelle; soit une estimation donnée par un ensemble de v aleursappartenant à un intervalle : l"estimation parintervalle de confiancecontrôlé par un risque d"erreur fixéa priori.1

Estimations et intervalles de confiance

2 Estimation ponctuelle

2.1 Estimateur

Convergence

DÉFINITION1. - Unn-échantillon aléatoire issu d"une v.a.r.Xest un en- semble(X1;:::;Xn)denv.a.r. indépendantes et de même loi queX. Soitun paramètre associé à la loi deX, par exemple=E(X)ou= Var(X). À partir de l"observation d"un échantillon aléatoire(X1;:::;Xn), on souhaite estimer le paramètre. DÉFINITION2. - Un estimateurbndeest une fonction qui dépend unique- ment dun-échantillon(X1;:::;Xn). Il est dit convergent s"il est "proche" de au sens de la convergence en probabilité : pour tout >0, P jbnj> !n!+10:

Dans l"exemple de l"introduction, la quantité

1n P n i=1Xiest un estimateur convergent depet si, par exemple, on a observé21pièces défectueuses sur un lot de1500pièces prélevées, l"estimation ponctuelle depobtenue estx n= 21=1500 = 1;4%. Pour estimer l"espérancedes variables aléatoiresXi, on utilise la moyenne empiriqueX n=1n n X i=1X i; car par la LGN, on sait qu"elle converge en probabilité vers l"espérance =E(X1). Le but de la théorie de l"estimation est de choisir, parmi toutes les statistiques possibles, le "meilleur" estimateur convergent, c"est-à-dire celui qui donnera une estimation ponctuelle la plus proche possible du paramètre et ceci, quel

que soit l"échantillon.Exemple :Considérons une v.a.r.Xreprésentant le nombre de grippes attra-

de paramètre >0. Chercher la loi deX, c"est chercher, qui n"est autre que l"espérance mathématique deX. Par conséquent, la LGN nous indique queX n est un estimateur convergent de: pour tout >0, P 1n n X i=1X i n!+10: Grâce à l"inégalité de Chebychev, on peut démontrer le théorème suivant : THÉORÈME3. - Soitbnun estimateur de. Si l"on a : lim n!+1E(bn) =et limn!+1Var(bn) = 0; alors bnest un estimateur convergent de. Biais DÉFINITION4. - Soitbnun estimateur convergent d"un paramètre. On appelle biais la quantitéE(bn). L"estimateurbnest dit sans biais si

E(bn) =, et biaisé sinon.

Exemple :La moyenne empiriqueX

nest un estimateur convergent et sans biais de l"espérance mathématique.

Écart quadratique moyen

Notons que l"on a

E n (bn)2o =En (bnE(bn) +E(bn))2o =En (bnE(bn))2+ (E(bn))2+ 2(bnE(bn))(E(bn))o =Var(bn) + (biais)2; car le termeEn (bnE(bn))(E(bn))o est nul. Ainsi, pour rendre l"écart quadratique moyenEn (bn)2o le plus petit possible, il faut que2

Estimations et intervalles de confiance

-E(bn) =, donc choisir un estimateur sans biais, la v arianceV ar(bn)soit faible. On choisira donc, parmi les estimateurs convergents et sans biais, celui qui a la variance la plus petite. En d"autres termes, si bnest un estimateur convergent et sans biais de, on a tout intérêt à ce quebnne varie pas trop autour de sa

2.2 Estimateur d"une moyenne ou d"une proportion

On considère unn-échantillon(X1;:::;Xn)issu d"une loi de moyenne et de variance2, toutes deux inconnues. 1. d"après la LGN, la mo yenneempirique X nest un estimateur convergent de. 2. l"estimateur X nest sans biais. 3. par indépendance : V ar(X n) =2n 4. loi de X n: si X N(;2), alorsX n N(;2=n). lorsque nest grand, d"après le TCL, la loi deX nest approchée par une loi normaleN(;2=n). L"estimation d"une proportionpest un cas particulier du précédent, au sens où les v.a.r.Xiconsidérées sont de Bernoulli de paramètrep.

2.3 Estimateur de la variance

DÉFINITION5. - La variance empirique associée à unn-échantillon (X1;:::;Xn)est définie par S

2n=1n1n

X i=1(XiX n)2: DÉFINITION6. - Soit(Y1;:::;Yn)unn-échantillon de v.a.r. de loiN(0;1). On appelle loi du chi-deux àndegrés de liberté la loi de la v.a.r.Pn i=1Y2i, et on la note2(n).

Propriétés de la variance empirique :

1.S2nest un estimateur convergent de la variance2.2.S2nest sans biais.

3. loi de S2n: pas de résultat général. Cependant, siX N(;2), alors la v.a.r. n1

2S2nsuit une loi du chi-deux àn1degrés de libertés2(n1):

Remarque :PuisqueE(Yi) = 0;on aE(Y2i) =Var(Yi) = 1. SiVsuit une loi

2(n), alors

E(V) =E(Y21+:::+Y2n) =n:

Ainsi on retrouve le fait queS2nest un estimateur convergent et sans biais de 2:

E(S2n) =2n1E(2n1) =2:

3 Estimation par intervalle de confiance

Pour l"estimation ponctuelle, on considère

un paramètre inconnu , un ensemble de v aleursobservées (x1;:::;xn), réalisations d"unn- échantillon aléatoire(X1;:::;Xn), et son estimation ponctuellex n= 1n P n i=1xi. Les estimations ponctuelles n"apportent pas d"information sur la précision des résultats, c"est-à-dire qu"elles ne tiennent pas compte des erreurs dues aux fluc- tuations d"échantillonnage. Pour évaluer la confiance que l"on peut avoir en une valeur, il est nécessaire de déterminer un intervalle contenant, avec une certaine probabilité fixée au préalable, la vraie valeur du paramètre : c"est l"es- timation par intervalle de confiance.

3.1 Définition d"un intervalle de confiance

Soit(X1;:::;Xn)unn-échantillon aléatoire etun paramètre inconnu de la loi desXi. DÉFINITION7. - Soit2]0;1[. S"il existe des v.a.r.min(X1;:::;Xn)et max(X1;:::;Xn)telles que P

2[min(X1;:::;Xn);max(X1;:::;Xn)]= 1;

on dit alors que[min(X1;:::;Xn);max(X1;:::;Xn)]est un intervalle de confiance pour, avec coefficient de sécurité1:On le noteIC1().3

Estimations et intervalles de confiance

Dans la pratique, on peut prendre par exemple= 5%, ce qui nous donne un IC à95%. Cela signifie qu"il y a95%de chance que la valeur inconnuesoit comprise entremin(x1;:::;xn)etmax(x1;:::;xn).

3.2 Intervalle de confiance pour la moyenne et la va-

riance dans le cas d"un échantillon gaussien Soit(X1;:::;Xn)unn-échantillon de v.a.r. de loiN(;2). Estimation de l"espérancelorsque la variance2est connue

Pour estimer, on utilise la moyenne empiriqueX

n=1n P n i=1Xiqui a pour loiN(;2=n). Il en résulte que pn X n N(0;1); et que P z1=2pn X n z1=2 = 1:

Ceci équivaut à

P X nz1=2pn X n+z1=2pn = 1: On obtient donc un IC pour l"espéranceavec coefficient de sécurité1 dans le cas oùest connu : il s"agit de l"intervalle aléatoire X nz1=2pn ;X n+z1=2pn

Ainsi, dans les calculs, l"IC est donné par

IC

1() =x

nz1=2pn ;x n+z1=2pn oùx nest l"estimation ponctuelle deassociée à la réalisation dun-échantillon (X1;:::;Xn).Estimation de l"espérancelorsque la variance2est inconnue Lorsque la variance2est inconnue, il est alors nécessaire de remplacer dans les formules précédentes cette quantité par la variance empirique, qui en est un estimateur convergent. Il faut donc considérer non plus la quantitépn X n mais plutôt pn X nS n qui ne suit plus une loi normale mais une loi dite de Student àn1degrés de liberté, que l"on noteTn1. La densité de la loi de Student est une fonction paire, comme la loi normaleN(0;1). On dispose de tables pour obtenir les quantiles de cette loi. On en déduit donc que P t1=2pn X nS n t1=2 = 1; ce qui équivaut à P X nt1=2S npn X n+t1=2S npn = 1: On obtient donc un IC pouravec coefficient de sécurité1, dans le cas où la variance2est inconnue : il s"agit de l"intervalle aléatoire X nt1=2S npn ;X n+t1=2S npn

Ainsi, dans les calculs, l"IC est donné par

IC

1() =x

nt1=2s npn ;x n+t1=2s npn oùx nets2nsont les estimations ponctuelles respectives de la moyenneet de la variance2. Remarque :Si les v.a.r.X1;:::;Xnne sont pas gaussiennes mais quenest assez grand (en pratique supérieur à 30), alors le TCL nous garantit que la moyenne empirique suit approximativement la loiN(;2=n). Ainsi, dans4

Estimations et intervalles de confiance

le cas où l"on souhaite estimer l"espérance lorsque la variance est connue, l"IC est identique à celui déterminé lorsque les v.a.r.X1;:::;Xnsuivent la loiN(;2).

Estimation de la variance2

On estime la variance2, supposée inconnue, par la variance empirique S

2n=1n1P

n i=1(XiX n)2:On sait que la v.a.r.S2na pour loi2n12(n1) et que

E(S2n) =2n1E(2(n1)) =2;

c"est-à-dire queS2nest un estimateur sans biais de2. De plus, on lit dans des tables les quantiles d"ordre=2et1=2de la loi du2(n1), respectivement notésv=2etv1=2(il est normal que les quantiles qui nous intéressent ne soient pas opposés car la densité de cette loi n"est pas paire, à l"inverse de la loi normale centrée réduite). On obtient alors P v =2n1

2S2nv1=2

= 1:

Ceci équivaut à

P(n1)S2nv

1=22(n1)S2nv

=2 = 1: On obtient donc un IC pour la variance2avec coefficient de sécurité1: il s"agit de l"intervalle aléatoire(n1)S2nv

1=2;(n1)S2nv

=2

Ainsi, dans les calculs, l"IC est donné par

IC

1(2) =(n1)s2nv

1=2;(n1)s2nv

=2 oùs2nest l"estimation ponctuelle de2associée à la réalisation dun-

échantillon(X1;:::;Xn):

s

2n=1n1n

X i=1(xix n)2:3.3 Intervalle de confiance pour la proportion Revenons à l"exemple introductif : on cherche à estimer la proportionde graines défectueuses du lot de céréales. On prélève un lot dengraines et on noteXila v.a.r. qui vaut1si la graineigerme, et0sinon. On estimepar la moyenne empiriqueX n=1n P n i=1Xi:Les v.a.r.Xiétant de Bernoulli, on peut alors utiliser l"approximation donnée par le TCL. SoitZ N(0;1)et z

1=2le quantile d"ordre1=2de la loiN(0;1). Par le TCL,

P n i=1Xinpn(1)L!Z N(0;1):

Ceci implique que

P z1=2P n i=1Xinpn(1)z1=2! n!+1P(z1=2Zz1=2) = 1; c"est-à-dire P X nz1=2p(1)pn X n+z1=2p(1)pn n!+11:

Ceci ne fournit pas un IC pourcar les bornes de l"intervalle dépendentde. Mais on peut montrer que l"on a le même résultat de convergence, en

remplaçantdans les bornes de l"intervalle par son estimateur convergentX n.On obtient alors P 0 B @X nz1=2qX n(1X n)pn X n+z1=2qX n(1X n)pn 1 C

A!n!+11:

On dit que l"intervalle

2 4X nz1=2qX n(1X n)pn ;X n+z1=2qX n(1X n)pn 3 5 est un IC asymptotique pour le paramètre, de coefficient de sécurité1. Pour= 5%, on lit dans les tablesz1=2=z97;5%= 1;96:Ainsi, le semencier en déduit qu"ayant observé36graines germées sur40, l"intervalle de confiance asymptotique pourest[0:807;0:993]; il suffit de remplacer nparl"estimationponctuellex n= 36=40).5

Estimations et intervalles de confiance

3.4 Exemple

Une entreprise chimique commercialise un polymère servant à la fabrication de microprocesseurs et stocké dans une cuve dont la caractéristique à contrôlerquotesdbs_dbs8.pdfusesText_14