PDFprof.com Search Engine



8 Statistique descriptive

PDF
Images
List Docs
  • Quelles sont les statistiques descriptives ?

    Les statistiques descriptives, comme leur nom l'indique, sont utilisées pour résumer ou décrire l'ensemble de données.
    En ce qui concerne les ensembles de données, ce sont des observations ou de réponses recueillies auprès d'une population ou d'un échantillon d'une population.

  • Quels sont les 3 caractéristiques de la statistique descriptive ?

    *Continue : peut prendre toutes les valeurs numériques d'un intervalle déterminer (taille, poids…). *Discontinue (discrète) : ne peut prendre que des valeurs numériques isolées (nombre de pièces d'habitations, nombre de fruits endommagés…).
    MODALITE l'une des formes particulières d'un caractère.

  • Quels sont les différents types de statistiques ?

    Les différents aspects de la statistique sont regroupés en différents domaines ou concepts : la statistique descriptive, plus couramment appelée aujourd'hui statistique exploratoire, l'inférence statistique, la statistique mathématique, l'analyse des données, l'apprentissage statistique, etc.

  • Le but de la statistique descriptive est de structurer et de représenter l'information contenue dans les données.
    La population est l'ensemble des sujets observés.
    Le caractère est la propriété étudiée sur ces sujets.
Définition. La statistique descriptive est un ensemble de méthodes. (représentations graphiques et calculs de caractéristiques.Autres questions

8 Statistique descriptive
Statistique DescriptiveÉlémentaire
Cours de statistique descriptive HAL
Résumé de cours de Statistiques descriptives
Filière Génie Informatique
Cycle Ingénieur en Génie Informatique
GÉNIE INFORMATIQUE
Génie Informatique
GUIDEDE L'ETUDIANT EN GÉNIE INFORMATIQUE
Cours de Génie Logiciel avec exercices résolus
Le génie informatique
Next PDF List

8 Statistique descriptive
1/42/4 3/4 4/4 8. Statistique descriptiveMTH2302DS.

Le Digabel,Ecole Polytechnique de MontrealA2017(v1)MTH2302D: statistique descriptive1/471/42/4 3/4 4/4 Plan1.

Introduction2. Terminologie3. Descriptions graphiques des donnees4. Descriptions numeriques des donneesMTH2302D: statistique descriptive2/471/42/4 3/4 4/4 1. Introduction2. Terminologie3. Descriptions graphiques des donnees4.

Descriptions numeriques des donneesMTH2302D: statistique descriptive3/471/42/4 3/4 4/4 IntroductionILastatistique fa itintervenir la collec te,la p resentationet l'analyse de donnees, ainsi que leur utilisation dans le but deresoudre des problemes.ID'une autre maniere, la statistique est une disciplinescientique dont le but estIde planier et recueillir des donnees pertinentes,Id'extraire l'information contenue dans un ensemble de donnees,Ide fournir une analyse et une interpretation des donnees ande pouvoir prendre des decisions.ILa statistique utiliseIdes notions de probabilites,Ides notions de mathematiques.MTH2302D: statistique descriptive4/471/42/4 3/4 4/4 Introduction (suite)DenitionLastatistique descriptive est un ensemble de m ethodes(representations graphiques et calculs de caracteristiquesnumeriques) permettant de faire une synthese statistique dedonnees.

Les donnees a examiner proviennent generalement d'unechantillon.MTH2302D: statistique descriptive5/471/42/4 3/4 4/4 1.

Introduction2. Terminologie3. Descriptions graphiques des donnees4.

Descriptions numeriques des donneesMTH2302D: statistique descriptive6/471/42/4 3/4 4/4 TerminologieIL'universest l'ensemble des objets sur lesquels porte l'etudestatistique.IUnevariableest une caracteristique selon laquelle l'univers estetudie.ILapopulationest l'ensemble de toutes lesmesuresouobservationsde la variable dans l'univers considere.IUneunite experimentaleest un objet de l'univers, sur lequel lavariable est mesuree.IUnechantillonest un sous-ensembleIde l'univers : s'il est compose d'unites exerimentales,Ide la population : s'il est compose de mesures de la variable.MTH2302D: statistique descriptive7/471/42/4 3/4 4/4 Terminologie (suite)IUnparametreest une mesure caracterisant la variabledans lapopulation.Par exemple : la moyenne de la population.En general, la vraie valeur d'un parametre est inconnue.IUnestatistiqueest une mesure caracterisant la variabledansun echantillonde la population.Par exemple : la moyenne echantillonnale.Une statistique peut ^etre calculee.MTH2302D: statistique descriptive8/471/42/4 3/4 4/4 Exemple 1On a mesure l'indice d'octane de 80 specimens de carburant etobtenu les resultats du tableau suivant :88.594.788.288.593.387.491.190.587.791.190.890.191.888.492.693.783.491.088.389.292.388.989.892.786.794.298.888.390.491.290.692.287.587.894.285.390.189.391.192.291.589.992.787.993.094.490.491.288.688.393.288.688.792.789.391.0100.387.691.090.989.991.889.792.295.684.390.389.089.891.690.390.093.386.793.496.189.690.491.690.

7) MTH2302D: statistique descriptive9/471/42/4 3/4 4/4 Exemple 2On a tire 25 circuits electroniques de la production d'une usine eton a mesure la longueur et la resistance a la traction des lsd'interconnexion de chaque circuit.No. de Resistance a Longueursl'observation la traction (y) des ls (x)1 9.95 22 24.45 83 31.75 114 35.00 105 25.02 86 16.86 47 14.38 28 9.60 2 MTH2302D: statistique descriptive10/471/42/4 3/4 4/4 1.

Introduction2. Terminologie3. Descriptions graphiques des donnees4.

Descriptions numeriques des donneesMTH2302D: statistique descriptive11/471/42/4 3/4 4/4 Utilite des descriptions graphiquesIPresenter les donnees de facon a en avoir une vue d'ensemble.IUtile pour interpreter les donnees et observer facilement :Itendance centrale,Ietalement,Icomparaison,Ivaleurs suspectes ou aberrantes,I MTH2302D: statistique descriptive12/471/42/4 3/4 4/4 Distribution de frequencesIL'ensemble des valeurs mesurees de la variable est subdiviseen sous-intervalles (classes).

Si on andonnees, environpnclasses est un bon choix.IOn construit un tableau de la forme :Classe Frequence Frequence Pourcentage Pourcentagecumulative cumulatifaxb MTH2302D: statistique descriptive13/471/42/4 3/4 4/4 Exemple 3On a mesure l'indice d'octane de 80 specimens de carburant etobtenu les resultats du tableau presente plus haut.

Le tableau defrequences obtenu avecStatisticaest :Frequency table: Octane1 (octane.sta)K-S d=,08357, p> .20; Lilliefors p<,20CategoryCount CumulativeCountPercentof ValidCumul %of Valid% of allCasesCumulative %of All80,00000 Si on andonnees, environpnsous-intervalles estun bon choix.

Les intervalles ne sont pas necessairementegaux.ISur chaque intervalle on construit un rectangle dont l'aire estproportionnelle a la frequence relative de la classe.Si les intervalle sont egaux alors la hauteur du rectangle est lafrequence de la classe correspondante.IOn peut avoir un histogrammeIDes frequences.IDes frequences cumulees.MTH2302D: statistique descriptive15/471/42/4 3/4 4/4 Exemple 4On a mesure l'indice d'octane de 80 specimens de carburant etobtenu les resultats du tableau presente plus haut.

Leshistogrammes des frequences et des frequences cumulees obtenusavecStatisticasont aux pages suivantes.MTH2302D: statistique descriptive16/471/42/4 3/4 4/4 Exemple 5MTH2302D: statistique descriptive17/471/42/4 3/4 4/4 Exemple 6MTH2302D: statistique descriptive18/471/42/4 3/4 4/4 Diagramme tige-feuilleIChaque valeur observee est divisee en deux parties : lespremiers chires (tige) et les chires restants (feuille).IOn arrange les donnees dans un tableau ou chaque lignecommence par une tige, suivie des feuilles correspondant acette tige, dans l'ordre croissant.IAvantage : les donnes individuelles sont toujours visibles.MTH2302D: statistique descriptive19/471/42/4 3/4 4/4 ExemplesExemple 7les donnees10.2 11.5 11.9 13.1 10.2 12.4 12.6 11.6 10.7 13.2donnenttigefeuilleseectifs102.2.73115.6.93124.62131.22Exemple 8On a mesure l'indice d'octane de 80 specimens de carburant etobtenu les resultats du tableau presente plus haut.

Le diagrammetige-feuille obtenu avecStatisticaest a la page suivante.MTH2302D: statistique descriptive20/471/42/4 3/4 4/4 Stem and Leaf Plot: Octane1 (oOctane1one leaf=1 casestem°leaf (leaf unit=1,000000, e.g., 6°5 = 6,500000)Class n Percentiles 80° · · · · 81° · · · · 81° · · · · 82° · · · · 82° · · · · 83° 4 · · · · 83° · · · · 84° 3 · · · · 84° · · · · 85° 3 · · · · 85° · · · · 86° · · · · 86° 77 · · · · 87° 4 · · · · 87° 56789 · · · · 88° 23334 · · · · 88° 556679 · · · · 89° 0233 · · · · 89° 678899 · · · · 90° 01133444 · · · · 90° 56789 · · · · 91° 00011122 · · · · 91° 56688 · · · · 92° 2223 · · · · 92° 6777 · · · · 93° 02334 · · · · 93° 7 · · · · 94° 224 · · · · 94° 7 · · · · 95° · · · · 95° 6 · · · · 96° 1 · · · · 96° · · · · 97° · · · · 97° · · · · 98° · · · · 98° 8 · · · · 99° · · · · 99° · · · · 100° 3 · · · · 100° · · · ·min = 83,40000 max = 100,3000 Total N:00000101010021556 25%468 median5854 75%4513101100001001080MTH2302D: statistique descriptive21/471/42/4 3/4 4/4 Diagramme a points, nuage de pointsIDiagramme a points :une seule variableIChaque observation est representee par un point au-dessus dela valeur correspondante sur l'axe horizontal.IS'il y a plus d'une observation pour une valeur donnee, onsuperpose les points.INuage de points :deux variablesILes deux axes correspondent aux valeurs des deux variables.IChaque couple d'observations est represente par un point dansle plan.IS'il y a plus d'une donnee avec les m^eme valeurs, le pointcorrespondant peut ^etre represente par un autre symbole.IPermet de visualiser les relations possibles entre les variables.INuage de points : trois variables.

Ici, chaque point dansl'espace correspond a un triplet d'observations.MTH2302D: statistique descriptive22/471/42/4 3/4 4/4 Exemple 9On a tire 25 circuits electroniques de la production d'une usine eton a mesure la longueur et la resistance a la traction des lsd'interconnexion de chaque circuit.

Le nuage de points pour cesdeux variables, obtenu avecStatisticaest : MTH2302D: statistique descriptive23/471/42/4 3/4 4/4 Diagramme en bo^teDenitionUnquartileest l'une des trois valeurs, denoteesQ1;Q2etQ3, quidivisent les donnees en quatre parties egales, de sorte que chaquepartie contienne le quart des donnees.Diagramme en bo^te, oubo^te a moustaches, oubo^te de Tukey,oubox & whisker plot, oubox plot:IUne bo^te est dessinee, centree sur le deuxieme quartile avecdeux c^otes alignes avec les premier et troisieme quartiles.IUn segment est dessine de chaque c^ote de la bo^te, l'unjusqu'a la valeur minimum des donnees, l'autre jusqu'a lavaleur maximum.IUtile pour comparer deux echantillons.MTH2302D: statistique descriptive24/471/42/4 3/4 4/4 Exemple 10On a mesure l'indice d'octane dedeuxechantillons de 80specimens de carburant.

Le diagramme en bo^te obtenu avecStatisticaest :Box & Whisker Plot Median 25%-75% Min-Max Octane1 Octane2767880828486889092949698100102104MTH2302D: statistique descriptive25/471/42/4 3/4 4/4 Diagramme de ParetoIEn abscisse : les categories (possiblement non numeriques), enordre decroissant d'eectifs.IEn ordonnee : la frequence (eectif) de la categorie.IPour chaque categorie, on trace un rectangle dont la hauteurest l'eectif de la categorie.IOn relie les valeurs des eectifs cumules pour obtenir ungraphe lineaire par morceaux.IPermet de representer des categories non numeriques.IPermet de visualiser rapidement les categories les plusfrequentes.MTH2302D: statistique descriptive26/471/42/4 3/4 4/4 Exemple 11On distingue les defauts suivants pour une piece metallique faisantpartie d'une portiere d'automobile :Defaut EectifForme deciente 30Bosses, creux, rainures 4Absence de lubriant 5Mauvais detourage 21Mauvais ordre 6ebarbage non eectue 5Fentes ou trous manquants 6Autre defaut 4MTH2302D: statistique descriptive27/471/42/4 3/4 4/4 Exemple 11 (suite)Le diagramme de Pareto obtenu avecStatisticaest :MTH2302D: statistique descriptive28/471/42/4 3/4 4/4 Diagramme chronologiqueICourbe lineaire par morceaux.IEn abscisse : le temps.IEn ordonnee : la valeur des observations pour chaque periodede temps.IUtile pour observer l'evolution de la variable dans le temps.MTH2302D: statistique descriptive29/471/42/4 3/4 4/4 Exemple 12La demande en electricite d'une region a ete mesuree a chaqueheure sur une periode de 24 heures.

Le diagramme chronologiquede la demande, obtenu avecStatisticaest :MTH2302D: statistique descriptive30/471/42/4 3/4 4/4 Equivalences de terminologieStatisticadistribution de frequencesfrequency tablehistogrammediagramme en barreshistogramdiagramme tige-feuillehistogramme de Tukeystem and leaf plotdiagramme a pointsnuage de pointsdiagramme de dispersionscatterplotdiagramme en bo^tediagramme de Tukeybox and whisker plotdiagramme de Pareto'polygone d'eectifsPareto chartdiagramme chronologique'line plotMTH2302D: statistique descriptive31/471/42/4 3/4 4/4 1.

Introduction2. Terminologie3. Descriptions graphiques des donnees4.

Descriptions numeriques des donneesMTH2302D: statistique descriptive32/471/42/4 3/4 4/4 Trois types de mesures numeriquesIMesures de tendance centrale : moyenne, mediane, mode.IMesures de dispersion (etalement) : etendue, ecartinterquartile, variance, ecart-type, coecient de variation,centiles.IMesure d'association : coecient de correlation.MTH2302D: statistique descriptive33/471/42/4 3/4 4/4 Tendance centrale : moyenne, mediane, modeSoitx1;x2;:::;xnun echantillon denobservations d'unepopulation (valeurs numeriques).Lamoyennede l'echantillon, oumoyenne echantillonnaleestx=1nnXi=1xi:La moyenne n'est pas necessairement egale a la valeur d'une desdonnees.MTH2302D: statistique descriptive34/471/42/4 3/4 4/4 Tendance centrale : moyenne, mediane, mode(suite)Lamedianede l'echantillon, denotee~x, est une valeur telle que50% des observations lui sont superieures et 50% lui sontinferieures.Six(1);x(2);:::;x(n)sont les donnees en ordre croissant alors~x=8<:x(n+12)sinest impair12x(n2)+x(n2+1)sinest pair:Sinest impair alors la mediane est egale a l'une des donnees.

Sinest pair, elle n'est pas forcement egale a l'une des donnees.MTH2302D: statistique descriptive35/471/42/4 3/4 4/4 Tendance centrale : moyenne, mediane, mode(suite)ILemodede l'echantillon est la valeur la plus frequente desdonnees.Un echantillon peut avoir plusieurs modes.Le mode est necessairement egal a l'une des donnees.IOn peut aussi denir le mode comme le point milieu de laclasse ayant le plus grand eectif.MTH2302D: statistique descriptive36/471/42/4 3/4 4/4 Dispersion : etendue, ecart interquartileSoitx1;x2;:::;xnun echantillon denobservations d'unepopulation (valeurs numeriques).IL'etenduede l'echantillon estR= maxfx1;x2;:::;xng minfx1;x2;:::;xng:IL'ecart interquartileestIQR=Q3Q1ouQ1etQ3sont les premier et troisieme quartiles.MTH2302D: statistique descriptive37/471/42/4 3/4 4/4 Dispersion : etendue, ecart interquartile (suite)Methode pour le calcul des quartiles1.Utiliser la mediane pour diviser les donnees en deux partiesegales.

Ne pas inclure la mediane dans les deuxsous-ensembles obtenus.Poser :Q2= mediane de l'echantillon.2.PoserQ1=mediane du sous-ensemble des valeurs inferieures aQ2.Q3=mediane du sous-ensemble des valeurs superieures aQ2.MTH2302D: statistique descriptive38/471/42/4 3/4 4/4 Dispersion : variance, ecart-type, coe. de variationSoitx1;x2;:::;xnun echantillon denobservations d'unepopulation (valeurs numeriques).Lavariancede l'echantillon, denotees2, est denie pars2=Sxxn1avecSxx=nXi=1(xix)2= nXi=1x2i!nx2=nXi=1x2i1n nXi=1xi!2.MTH2302D: statistique descriptive39/471/42/4 3/4 4/4 Dispersion : variance, ecart-type, coe. de variation(suite)IL'ecart-typede l'echantillon ests=ps2.ILecoecient de variationde l'echantillon me