quantitatif discret (les valeurs sont isolées) `a une dimension (une valeur par indi - La donnée des classes et de leurs effectifs est la distribution statistique
Previous PDF | Next PDF |
[PDF] Statistiques Descriptives à une dimension - USTO
Chapitre I Statistiques Descriptives à une dimension 1 I Introduction et commode de représenter les résultats consiste à créer une distribution statistique des
[PDF] Chapitre 1: Distribution Statistique à une dimension - PDF4PRO
Chapitre1 : Distribution Statistique à une dimension I H E T de Sidi Dhrif Cours Statistique descriptive Mahmoud BABAY 3 CHAPITRE 1 : Distribution
[PDF] Outils statistiques Notes de cours
CHAPITRE 1 COLLECTE CHAPITRE 2 STATISTIQUE DESCRIPTIVE `A UNE DIMENSION La variance s2 d'une série statistique ou d'une distribution de
[PDF] Résumé du Cours de Statistique Descriptive - UniNE
15 déc 2010 · CHAPITRE 2 STATISTIQUE DESCRIPTIVE UNIVARIÉE Ce diagramme permet d'avoir une vue synthétique de la distribution Évidemment,
[PDF] Chapitre 2 Caractéristiques des distributions à une variable
Ecart absolu Ecart-type et variance Comparaison de séries statistiques et synth` ese 3 Caractéristiques de concentration Courbe de Lorentz Indice de Gini
[PDF] Statistiques descriptives et exercices
4 Étude d'une variable statistique à deux dimensions 51 3 1 Une représentation de la distribution des valeurs à l'intérieur d'une classe 35
[PDF] STATISTIQUE DESCRIPTIVE
Le mode, désigné par Mo est la valeur de la variable statistique la plus fréquente Page 8 FIIFO 3 PROBABILITES - STATISTIQUES J-P LENOIR CHAPITRE 1
[PDF] Probabilités et Statistiques Chapitre 1 : Statistique descriptive 1
quantitatif discret (les valeurs sont isolées) `a une dimension (une valeur par indi - La donnée des classes et de leurs effectifs est la distribution statistique
[PDF] Chapitre 5 Statistiques descriptives bivariées - UFR SPSE
la population On notera nij l'effectif correspondant au couple (xi,yj) Définition On appellera distribution jointe des effectifs
[PDF] Calcul de la distance entre deux points1 - ipnas
[PDF] La distance horizontale entre deux points - Géodésie, Topographie
[PDF] Vitesse et distance d 'arrêt
[PDF] Vitesse et distance d 'arrêt
[PDF] La génétique - Free
[PDF] Comment obtenir la distance entre deux points connus - Géodésie
[PDF] Calcul de la distance entre deux points
[PDF] ET3 - RESEAUX: Présentation et dimensionnement des installations
[PDF] DONNEES TECHNIQUES
[PDF] Le pH 6 Le dosage des solutions d 'acides et des bases faibles
[PDF] LE SALAIRE
[PDF] Caisse Nationale de l 'Assurance Maladie - Cnamts
[PDF] La mesure de la pauvreté - Insee
[PDF] Pauvreté - Insee
U.P.S. I.U.T. A, D´epartement d"Informatique Ann´ee 2008-2009
Probabilit´es et Statistiques
EmmanuelPAUL
Chapitre 1 : Statistique descriptive
1 Objectifs des statistiques.
Il s"agit d"´etudier un ou plusieurs caract`eres (appel´esaussi variables statistiques) d"une po-
pulation. Exemples.On consid`ere la populationE={e1,e2,···en}desn´etudiants de premi`ere ann´ee du d´epartement d"informatique de l"IUT de Toulouse. On peut´etudier plusieurs caract`eres : - C :E-→ C(un ensemble de couleurs) qui `a chaque ´etudianteαassocieC(eα) = la couleur de ses yeux. C"est un caract`erequalitatif. - N :E-→N(ensemble des entiers naturels) qui `a chaque ´etudianteαassocie sa note N(eα) obtenue au contrˆole d"alg`ebre lin´eaire du premier semestre. C"est un caract`ere quantitatif discret(les valeurs sont isol´ees)`a une dimension(une valeur par indi- vidu). - T :E-→R(ensemble des nombres r´eels) qui `a chaque ´etudianteαassocie sa taille T(eα). C"est un caract`erequantitatif continu(le caract`ere peut `a priori prendre toute valeur dans un intervalle deRdonn´e) `a une dimension. - (T,P) :E-→R2(ensemble des couples de nombres r´eels) qui `a chaque ´etudianteα associe sa taille et son poids (T(eα),P(eα)). C"est un caract`erequantitatif continu `a deux dimensions. Exercice 1.Les variables statistiques suivantes sont-elles discr`etes ou continues? - le nombre d"actions vendues chaque jour `a la bourse de Paris; - les temp´eratures et pressions enregistr´ees chaque heure dans une station m´et´eo; - la dur´ee de vie d"un lot d"ampoules ´electriques fabriqu´ees par une usine; - le revenu mensuel de la population ouvri`ere en France. Lastatistique descriptivemet en ordre les donn´ees brutes d"un param`etre, notamment par des repr´esentations graphiques, et fournit des indicateurs de position (valeur moyenneetc...), de dispersion autour de la valeur moyenne (´ecart-type...), ou d"ind´ependance (dans le
cas de plusieurs caract`eres). Lastatistique math´ematique (ou inf´erentielle)fait des estimations sur un caract`ereuniquement `a partir d"une connaissance partielle du caract`ere sur un ´echantillon. Elle n´ecessite
l"utilisation de la th´eorie des probabilit´es. Elle permet des estimations (sondages etc...), et
devient une aide `a la d´ecision (tests statistiques). 12 Statistique descriptive `a une dimension.SoitE={e1,···en}une population etX:E→Nune distribution statistique quantitative
discr`ete. Soitx1,x2,···xkles valeurs prises par cette distribution rang´ees par ordre croissant.
Exercice 2.Donner les valeurs denetkpour l"exemple pr´ec´edent de la distributionNdes notes (suppos´ees enti`eres ou demi-enti`eres). Pour repr´esenter un caract`ere discret d"une population,on regroupe par classeCitous lesindividus dont le caract`ere prend la mˆeme valeurxi,i= 1,···k. On notenil"effectifde cette
classe. L"effectif totalest n=n1+n2+···nk=k? i=1n i. La donn´ee des classes et de leurs effectifs est ladistribution statistiqueassoci´ee `aX.L"effectif cumul´edesipremi`eres classes est :
N i=n1+n2+···ni=i? k=1n k. La proportion de la population prenant la valeurxiest donn´ee par lafr´equence: f i=ni n.La proportion de la population prenant une valeur inf´erieure ou ´egale `axiest donn´ee par la
fr´equence cumul´eedesipremi`eres classes : F i=f1+f2+···fi=Ni n. On la prolonge pour toutxr´eel par la fonction en escalier :F(x) =? x de r´epartition). La proportion de la population dont le caract`ere prend une valeur dans ]a,b] (attention aux bornes!) est donn´ee parF(b)-F(a).
Exemple 1.La population ´etudi´ee est un ensemble de 30 familles. Le caract`ere discret ´etudi´e
Xest le nombre d"enfants. Les classes et leurs effectifs sont donn´es par le tableau suivant : classesC1C2C3C4C5C6C7C8 valeurs01234567 effectifs57842211 effectifs cumul´es fr´equences fr´equences cumul´ees 2Exercice 3.
1- Compl´etez ce tableau.
2- Quel est le pourcentage de familles admettant deux enfants?
3- Quel est le pourcentage de familles admettant au plus un enfant?
4- Quel est le pourcentage de familles admettant 2 `a 5 enfants?
Leshistogrammesdes effectifs, puis des effectifs cumul´es (obtenus sous Maple : voirTP1) sont repr´esent´es ci-dessous. On a utilis´e la convention suivante : la largeur des colonnes
contenant chaque valeur est identique pour chaque classe, et la hauteur ´egale `a l"effectif. L"his-
togramme des fr´equences (ou des fr´equences cumul´ees) est identique mais avec une graduation
diff´erente de l"axe vertical (les ordonn´ees sont ici divis´ees parn= 30). 8 6 6 4 2 4 0 0 2Figure1 - Histogramme des effectifs
00 4 62530
25101520
Figure2 - Histogramme des effectifs cumul´es
3 Pour un caract`ere continu, on partitionne l"ensemble de ses valeurs en une collection d"intervallesI1,I2, ...Ikde la forme [ci-1,ci[. La classeCiregroupe les individus dont le caract`ere prend sa valeur dans l"intervalle [ci-1,ci[. On note `a nouveaunison effectif. Les notions d"effectifs cumul´es, fr´equences et fr´equences cumul´ees sont identiques. La fonction de r´epartitionFest maintenant construite comme suit : on place la valeur0 au dessus de l"extr´emit´e gauche deI1,F1au dessus de son extr´emit´e droite, puis chaque
valeurFiau-dessus de l"extr´emit´e droite de l"intervalleIi, en terminant par la valeur 1 `a l"extr´emit´e droite du dernier intervalle. On joint les points obtenus. - La valeurF(a) repr´esente le pourcentage de la population dont le caract`ere prend une valeur inf´erieure ou ´egale `aa. - La valeur 1-F(a) repr´esente le pourcentage de la population dont le caract`ere prend une valeur strictement sup´erieure `a a. - La diff´erence des valeursF(b)-F(a) repr´esente le pourcentage de la population dont le caract`ere prend une valeur dans l"intervalle ]a,b]. Exemple 2.La distributionYdes tailles d"une population de 100 coll´egiens est donn´eepar le tableau : classesC1C2C3C4 valeurs en cm.[150,155[[155,160[[160,165[[165,170[ effectifs30252322 effectifs cumul´es fr´equences fr´equences cumul´ees1651601551506
5 4 3 2 1 0 170Figure3 - Histogramme des effectifs
Remarque :L"aire de chaque rectangle est ´egale `a l"effectif de la classe (d"o`u la graduation verticale). 4 16520160
15 10 155
5 0
150170
Figure4 - Histogramme des effectifs cumul´es
Exercice 4.
1- Compl´etez le tableau de la distribution deY.
2- D´eterminer graphiquement le pourcentage de la population dont la taille est inf´erieure `a 163
cm, `a l"aide de l"histogramme des effectifs cumul´es ci-dessous (on tracera d"abord le graphe de la fonction de r´epartition sur l"histogramme des effectifs cumul´es.)3- D´eterminer ce pourcentage par le calcul : on cherchera d"abord l"´equationy=ax+bdu
segment de droite concern´e, puis l"ordonn´ee associ´ee `al"abscisse fournie, et enfin l"effectif
puis la fr´equence correspondante.3 Param`etres d"une distribution statistique.
3.1 Param`etres de position.
Moyenne.On consid`ere la populationE={eα,α= 1,···n}et le param`etre quantitatifX. Soitx1,···xkles valeurs prises parX`a valeurs discr`etes, etn1,···nkla distribution
d"effectifs correspondante. Si le caract`ere est continuxid´esigne le milieu de l"intervalle des valeurs [ci-1,ci[ :xi= (ci-1+ci)/2.Le principal param`etre de position d"une distribution statistique est samoyenne: m=1 nnα=1X(eα) =1nk
i=1n ixi=k? i=1f ixi. Remarque :la seconde expression est simplement obtenue en regroupantles termesX(eα) de la premi`ere somme prenant mˆeme valeurxi. Elle est plus rapide `a calculer. 5 Exercice 5.Calculer les moyennesmXetmYdes distributions statistiquesXetYdu paragraphe pr´ec´edent. Remarque.Etant donn´ees deux distributions statistiquesXetYsur un mˆeme ensemble on peut consid´erer la distribution sommeX+Y: on somme les valeurs associ´ees `a chaque individu. On peut aussi multiplier une distribution par un nombre r´eelλ. NotonsmXetmYles moyennes de chaque distribution. On v´erifie facilementles propri´et´es de lin´earit´e :
mX+Y=mX+mY,etmλX=λmX.
M´ediane.Le second param`etre de position fr´equemment utilis´e estlam´ediane: c"est la valeur not´eex1/2qui partage la population en deux parties de mˆeme effectif : les individusdont le caract`ere est inf´erieur `a cette valeur et ceux pour lesquels le caract`ere est sup´erieur
`a cette valeur. C"est donc la valeur pour laquelle la fonction de r´epartition vaut 1/2. On la calcule de la mani`ere suivante : -Cas discret avecnpetit: on range les valeurs par ordre croissant :x1<···< xkenr´ep´etantnifois chaque valeurxi. La m´edianex1/2est la valeur s´eparant cette suite en deux
parties d"effectif ´egal. Dans le cas o`unest pair,x1/2tombe entre deux valeurs distinctes : on prend alors pourx1/2le milieu de ces valeurs.Exercice 6.
- Calculer la m´ediane de la distribution de la distributionstatistiqueXdu paragraphe pr´ec´edent. - Que serait devenue cette m´ediane si la famille de 7 enfantsen avait eu 18? - Cela aurait-il chang´e la moyenne? On conclut donc que la m´ediane, contrairement `a la moyenne est insensible aux valeurs "ex- ceptionnelles" qui peuvent parfois provenir d"une erreur de relev´e ou d"exp´erience. -Cas continu: on trace le graphe de la fonction de r´epartitionF. On obtient la m´ediane x1/2en r´esolvant l"´equationF(x) = 1/2.Pour cela, on cherche laclasse m´ediane, c"est-`a-dire
l"intervalle de valeurs [a,b] contenant la m´ediane : les ordonn´eesF(a) etF(b) pour la fonction
droite correspondant est donn´ee par : p=F(b)-F(a) b-a=1/2-F(a)x1/2-a d"o`u la formule : x1/2=a+ (b-a)×1/2-F(a)
F(b)-F(a).
Exercice 7.D´eterminer la classe m´ediane de la distributionY, puis obtenir sa m´ediane, d"abord sur le graphique du paragraphe 2, puis par le calcul. 6Autres param`etres de position :
- on d´efinit de mˆeme que la m´ediane lesquartilesx1/4etx3/4comme ´etant les valeurspour lesquellesFvaut 1/4 ou 3/4. Ils se calculent de la mˆeme mani`ere que la m´ediane : mˆeme
formule en rempla¸cant 1/2 par 1/4 (ou 3/4) et en choisissantl"intervalle [a,b] de sorte que les ordonn´ees parFencadrent 1/4 (ou 3/4). On d´efinirait de mˆeme lesd´eciles,centiles... - le (ou les)modes(ou classes modales) : il s"agit d"une classe d"effectif maximal. Il peut y en avoir plusieurs.Exercice 8.
- Quels sont les quartilesx1/4etx3/4de la distributionY? - Quelle est la classe modale de cette distribution?3.2 Param`etres de dispersion.
Ils mesurent l"´eloignement entre les valeursxiet la valeur moyennem, et se calculent donc`a partir des ´ecarts|xi-m|. On moyennise ensuite ces ´ecarts de deux mani`eres diff´erentes :
- l"´ecart-moyen (peu utilis´e) : c"est la moyenne des ´ecarts :1 n? k i=1ni|xi-m|. -l"´ecart-type(tr`es utilis´e) : c"est la moyenne quadratique des ´ecarts: 1 nk i=1n i(xi-m)2.Remarques :
- le carr´e de l"´ecart-typeσ2est appel´e "variance" deX. - On peut aussi calculerσ2en utilisant la formule de Koenigs (d´emontrez-l`a!) : 2=1 nk i=1n i(xi-m)2=1n(k? i=1n ix2i)-m2 Autres param`etres de dispersion (moins utilis´es) : - l"´etendue :xmax-xmin; - l"´ecart inter-quartilex3/4-x1/4. Exercice 9.Calculer les ´ecart-types des distributions statistiquesXetYdu paragraphe pr´ec´edent (voir le mode d"emploi de votre calculatrice).4 Statistique descriptive `a deux dimensions.
4.1 Distribution statistique `a deux dimensions, distributions mar-
ginales Soit (X,Y) :E→R2un caract`ere `a deux dimensions sur une population den´el´ements.Soitnij,i= 1,···k,j= 1,···l, l"effectif de la valeur (xi,yj) (ou dans le cas continu, d"une
7 classe d´etermin´ee par le produit de deux intervalles de valeurs). On a :n=?ki=1? l j=1nij (not´e en abr´eg´e :?quotesdbs_dbs22.pdfusesText_28