[PDF] Notes de cours - Statistique Descriptive



Previous PDF Next PDF







Cours de Statistique Descriptive - univ-lillefr

L’objectif de la Statistique Descriptive est de décrire de façon synthétique et parlante des données observées pour mieux les analyser Le terme «statistique»est issu du latin «statisti-cum»,c’est-à-direquiatraitàl’État Cetermeaétéutilisé,semble-t-ilpourlapremièrefois,



R esum e du Cours de Statistique Descriptive

Objectifs du cours – Apprendre les principales techniques de statistique descriptive univari´ee et bivari´ee – Etre capable de mettre en oeuvre ces techniques de mani`ere appropri´eeˆ dans un contexte donn´e – Etre capable d’utiliser les commandes de base du Language R Pouvoirˆ



STATISTIQUE DESCRIPTIVE - Fès

Dans cette étape intervient la Statistique descriptive (S1), objet de ce module, et l’inférence Statistique(S2) Quand les données sont exhaustives c'est-à-dire concernent toute la population, comme dans le cas du recensement, on fait recours à la statistique descriptive (Statistique déductive)



Cours de statistique descriptive - Faculté des sciences

B Grais (2000) Statistique descriptive 3e édition Dunod J Hubler (1996) Statistiques appliquées à l’économie Bréal INSEE (2005) L’économie française Comptes et dossiers INSEE A Piller (2004) Statistique descriptive Premium Editeur Cours de statistique descriptive – p 4/41



STATISTIQUE DESCRIPTIVE - WordPresscom

Dans l’évolution de la statistique au cours de l’histoire on peut distinguer trois étapes: Dans cette étape qui va de la plus haute antiquité jusqu’au 18 ième siècle, la statistique se réduit à des recensements et inventaires de caractère démographique ou comptable et reste une statistique de constatation



Cours 2 : Rappels de Statistique descriptive

9Objectifs de la statistique descriptive (ou exploratoire): résumer, synthétiser l’information contenue dans la série statistique, mettre en évidence ses propriétés suggérer des hypothèses relatives à la population dont est issu l’échantillon 9Outils utilisés : Tableaux (table des fréquences, de contingence, )



Résumé de cours de Statistiques descriptives Elaboré par

La statistique descriptive consiste à recueillir, synthétiser et résumer les données b‐Statistique inférentielle: c’est l’ensemble des techniques qui permettent de généraliser des conclusions relatives à la population entière, à partir d’un sous-ensemble tiré selon une méthode scientifique de cette population La statistique



Notes de cours - Statistique Descriptive

Notes de cours - Statistique Descriptive Licence Mathématiques et informatique appliquées aux sciences humaines et sociales Université de Bordeaux UE : Bases en statistiques - Première année Licence MIASHS Rédaction : Brigitte Patouille et Jérôme Poix Enseignants impliqués dans l’UE

[PDF] cours de statistique licence 1

[PDF] cours de statistique licence 1 eco gestion

[PDF] statistique 1ere st2s

[PDF] série statistique ? deux variables st2s

[PDF] ajustement affine st2s

[PDF] hypothèse h0 et h1

[PDF] exercice statistique 1ere s pdf

[PDF] exercices maths 1ère sti2d

[PDF] exercice probabilité 1ere sti2d

[PDF] produit scalaire terminale sti2d

[PDF] cours 1ere sti2d physique

[PDF] exercice produit scalaire 1ere sti2d

[PDF] programme 1ere sti2d maths

[PDF] programme terminale sti2d physique

[PDF] programme terminale sti2d maths

Notes de cours - Statistique Descriptive

Licence Mathématiques et informatique appliquées aux sciences humaines et sociales

Université de Bordeaux

UE : Bases en statistiques - Première année Licence MIASHSRédaction: Brigitte Patouille et Jérôme Poix

Enseignants impliqués dans l"UE

Jérémie Bigot, Marie Chavent, Vincent Couallier, Brigitte Patouille

2016-2017

2

Table des matières

1 Les données5

2 Statistique descriptive à une variable 7

2.1 Distribution statistique associée à un échantillon . . . . . . . . . . . . . . . . . . . . 7

2.2 Fréquence, effectif cumulé et fréquence cumulée . . . . . . . . . . . . . . . . . . . . . 9

2.3 Représentations graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3.1 Diagramme circulaire (camembert) . . . . . . . . . . . . . . . . . . . . . . . . 10

2.3.2 Diagramme des effectifs et des fréquences . . . . . . . . . . . . . . . . . . . . 10

2.3.3 Diagrammes d"effectifs et de fréquences cumulés . . . . . . . . . . . . . . . . . 12

2.4 Paramètres caractérisant une variable statistique . . . . . . . . . . . . . . . . . . . . 14

2.4.1 Paramètres (ou indicateurs) de position (ou de centralité) . . . . . . . . . . . 14

2.4.2 Paramètres de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

2.4.3 Propriétés de la variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3 Statistique descriptive à deux variables 22

3.1 Distribution statistique d"un couple de variables . . . . . . . . . . . . . . . . . . . . . 22

3.2 Distributions conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.2.1Yquantitative etXqualitative (ou quantitative) . . . . . . . . . . . . . . . . 24

3.2.2XetYqualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.2.3XetYquantitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3 4

1 Les données

Lesdonnées statistiquesse présentent sous la forme d"individuspour lesquels sont mesurés un certain nombre decaractères(ou"variables statistiques"). L"ensemble des individus constitue unéchantillon(ou encore unesérie statistique), formant ainsi un sous-ensemble d"un groupe (beaucoup) plus grand appelé"population". Les caractères statistiques peuvent être de plusieurs natures :

Lesvariables qualitatives:

Exemples : nationalité d"une personne, profession. Les valeurs possibles d"une variable qualitative sont appelées lesmodalités; Exemples :"Français", "Britannique", "Professeur", "Médecin". Remarque :Certaines variables qualitatives peuvent parfois comporter un ordre "naturel" ;

Exemple : variable "activité sportive" avec les modalités "peu sportif", "assez sportif", "très sportif".

Lesvariables quantitatives(qu"on peut mesurer);

- Lesvariables quantitatives discrètes: variables prenant leurs valeurs dans un ensemble fini ou dénombrable (en généralN); Exemples : âge d"une personne (en années), nombre d"enfants dans une famille. Pour ces variables, les valeurs possibles sont également appeléesmodalités. - Lesvariables quantitatives continues: variables qui peuvent prendren"importe quelle valeurdans un intervalle deR, c"est à dire mesurées avec une très grande précision. Exemples : taille d"un individu (en mm), poids (en g), temps d"une réaction chimique (en micro- secondes).

En résumé :

Soit uncaractère statistiqueX.

Unéchantillon(ousérie statistique) pour ce caractère peut se représenter par la donnée d"une

suite de nombres : fx1;x2;:::;xng; où : -nest le nombre d"observations (ou encore lataille de l"échantillon) - et8i;1in,xireprésente la valeur du caractèreXpour l"individui. Les données présentées sous cette forme sont appelées lesdonnées brutes. On peut également les représenter sous la forme d"un tableau :IndividuX 1x 12x 2. ..nx nExemple de tableau de données à 4 individus et 3 variables : 5

SexeNombre de frères et soeursTaille(cm)

1M1143

2M2149

3F0144

4F2146

Pour un tableau de données ànindividus etkvariables, on peut étudier les données de plusieurs

façons :

-1 variable à la fois!statistique descriptive à 1 variable, étude d"un caractère statistique;

-2 variables à la fois!statistique descriptive à 2 variables, étudesimultanéede 2 carac- tères statistiques; -+ de 2 variables à la fois!statistique exploratoire, analyse des données (méthodes plus lourdes et plus complexes, calculs intensifs). 6

2 Statistique descriptive à une variable

2.1 Distribution statistique associée à un échantillon

Variables qualitatives ou quantitatives discrètes.

Définition 1 :Une distribution statistique d"un échantillon denobservations d"une variable qua-

litative ou quantitative discrèteX(ou bien d"un caractère qualitatif ou quantitatif discret) est

constituée par la donnée d"un regroupement f(a1;n1);(a2;n2);:::;(ap;np)g; où : - lesai,1ipreprésentent les modalités de la variable statistiqueX(classées le plus souvent en ordre croissant,a1< a2<< ap),pétant le nombre de modalités; - le nombreni,1ip, appeléeffectif de la modalitéreprésente le nombre d"individus pour lesquels la variableXa la modalitéai,1ip. -pX i=1n i=n On peut représenter une distribution statistique discrète par un tableau :X(modalités)a 1a 2:::a pEffectifn 1n 2:::n pExemple :

Données brutes Distribution statistique

(Données regroupéesou"triées à plat")iÂgexi120 218
318
419
517
618
722
818
920

1018ÂgeEffectif

Variables quantitatives continues : deux approches possibles.

Première approche :On peut considérer un échantillon d"un caractère continu comme celui d"un

caractère discret à valeur dans un sous-ensemble fini deR. !même définition de la distribution que dans le cas discret.X(modalités)a 1a 2:::a pEffectifn 1n 2:::n p7 On appellera cette distribution la"distribution empirique"du caractèreX.

Mais si l"hypothèse de continuité du caractère est pertinente, alorsp'n, et (presque) tous les

effectifsniseront égaux à 1. On se retrouve donc avec les données brutes dans ce cas.

!Les "modalités" sont les différentes valeurs prises par le caractère.Elles dépendent ici des

observations de l"échantillon. Remarque 1 :Cette définition de la distribution d"un caractère continu correspond seulement au

classement dans l"ordre croissant des données et au regroupement éventuel des quelques observations

qui pourraient être identiques.

Seconde approche :Pour obtenir une représentation synthétique des données, on a besoin d"ef-

fectuer unregroupement en classes.

Définition 2 :Une distribution statistique d"un échantillon denobservations d"une variable quan-

titative continue (ou d"un caractère quantitatif continu)Xregroupée en classesest constituée

par la donnée d"un regroupement f(C1;n1);(C2;n2);:::;(Cp;np)g; où : - lesCi,1ipsont des intervalles appelésclasseset formant une partition de l"ensemble des valeurs possibles pourX, c"est à dire C

1= [a0;a1[; C2= [a1;a2[;:::; Cp= [ap1;ap[;

ou bien C

1=]a0;a1]; C2=]a1;a2];:::; Cp=]ap1;ap];

aveca0< a1<< ap. - le nombreni,1ip, appeléeffectif de la classereprésente le nombre d"individus pour lesquels la valeur de la variableXest dans la classeCi,1ip.

On peut représenter une distribution statistique continue par un tableau :X(classes)]a0;a1]]a1;a2]:::]ap1;ap]Effectifn

1n 2:::n pRemarque 2 :On a bien sûr pour un échantillon de taillen, n

1+n2++np=n:

Remarque 3 :Quand on passe des données brutes à la distribution, il y a perte d"information,

surtout dans le cas des variables continues, puisqu"on ne connaît plus les valeurs effectivement prises

par la variable.

En résumé :

Echantillon

(données brutes)

Distribution

Regroupement Regroupement

en modalités en classes (qual. ou quant. discret) (quant. continu) 8

Exemples de distributions statistiques :

1. Groupe sanguin de 100 personnes (variable ..Groupe sanguinAOBAB

Effectif40331413

2. Nombre d"enfants dans 80 familles (

Nb d"enfantsEffectif

06 120
227
317
46
53
61

3. Taille (en cm) de 24 individus (

154117111821

156117411841

157117621851

160117711861

163117911881

167218021911

170118111941

4. Poids (en kg) de 92 personnes (

Avec Regroupement/Découpage de classes :

Remarque 4 :Dans le cas continu, la distribution statistique dépend du choix des classes, qui est arbitraire. En pratique, les classes seront choisies de manière "raisonnable" : en fonction du nombre d"observations. en fonction de l"amplitude de l"échantillon = +grande valeur - (+petite valeur). pas trop petites (sinon à la limiteni= 0ouni= 1,8i: ce n"est plus un regroupement en classes!) pas trop grandes (sinon à la limite il ne reste qu"une ou deux classes : plus aucune information sur les données).

On choisit souvent des classes de même amplitude, mais il est fréquent de regrouper des classes

d"effectifs trop faibles, et de couper des classes d"effectifs trop grands.

2.2 Fréquence, effectif cumulé et fréquence cumulée

Définition 3 :Soitn=n1++npl"effectif total d"un échantillon. On appellefréquencede la modalitéai(ou de la classeCi) le nombre f i=nin 9 f

iest la proportion des sujets de l"échantillon qui ont une modalité deXégale àai(ou qui sont

dans la classeCi). SiXest quantitative ou qualitative ordinale et que lesaisont classés par ordre croissant (a1< a2<< ap), on appelleeffectif cumuléde la modalitéai(ou de la classeCi) le nombre : N i=n1++ni=iX j=1n j N i=n1++niest le nombre de sujets de l"échantillon qui ont une modalité deXinférieure ou

égale àai.

On appellefréquence cumuléede la modalitéai(ou de la classeCi) le nombre F i=Nin =f1++fi=iX j=1f j: F

iest la proportion des sujets de l"échantillon qui ont une modalité deXinférieure ou égale àai.

Ces deux dernières quantités n"ont pas de sens pour les variables purement qualitatives.

Remarque 5 :Le nombreficalculé sur un échantillon de taillenest une estimation de la fréquence

p

ide la modalitéai(ou de la classeCi) pour l"ensemble de la population. On appellepila "fréquence

théorique" ou encore probabilité de la modalité ou classe en question. On peut montrer sous certaines conditions que (loi dite des "grands nombres") lim n!+1fi=pi

2.3 Représentations graphiques

Elles représentent

les effectifs, les fréquences (tout type de variables), les effectifs cumulés, les fréquences cumulées (variables quantitatives ou ordinales), les valeurs d"un caractère statistique pour chaque individu.

2.3.1 Diagramme circulaire (camembert)

Cette représentation graphique est à réserver aux variables (purement) qualitatives. On divise le disque enpsecteurs représentant les modalités(a1;a2;:::;ap)et proportionnels aux

effectifs correpondants(n1;n2;:::;np). L"angle (en degrés) du secteur représentant la modalitéai

quotesdbs_dbs15.pdfusesText_21