Les caractères statistiques peuvent être de plusieurs natures : • Les variables qualitatives : Exemples : nationalité d'une personne, profession Les valeurs
Previous PDF | Next PDF |
[PDF] Cours de Statistique Descriptive
Certaines variables peuvent présenter plusieurs modes Par exemple, dans le cas de la variable « note à l'examen »l'effectif maximum correspond aux valeurs 11
[PDF] Statistiques descriptives et exercices
Rappels de cours et exercices corrigés sur la statistique descriptive Abdennasser 4 1 Représentation des séries statistiques à deux variables 52
[PDF] Résumé du Cours de Statistique Descriptive - UniNE
15 déc 2010 · Le tableau statistique d'une variable qualitative nominale peut être représenté par deux types de graphique Les effectifs sont représentés par
[PDF] Notes de cours - Statistique Descriptive
Les caractères statistiques peuvent être de plusieurs natures : • Les variables qualitatives : Exemples : nationalité d'une personne, profession Les valeurs
[PDF] Cours de Statistiques niveau L1-L2 - Archive ouverte HAL
7 mai 2018 · Prise en main du logiciel R et statistique descriptive univariée 2 Loi binomiale Introduction Deux classes de méthodes statistiques 1 la répartition statistique d'une variable au sein de la population est souvent voisine de
[PDF] Statistique descriptive
Cours 2 : Rappels de Statistique plusieurs variables faites sur une population ou un échantillon Objectifs de la statistique descriptive (ou exploratoire):
[PDF] Cours 2 Statistiques descriptives:couple de variables statistiques
Cours 2 Statistiques descriptives:couple de variables statistiques (affine) entre deux variables et la regression linéaire qui est la relation de prédiction
[PDF] cours de statistique licence 1 eco gestion
[PDF] statistique 1ere st2s
[PDF] série statistique ? deux variables st2s
[PDF] ajustement affine st2s
[PDF] hypothèse h0 et h1
[PDF] exercice statistique 1ere s pdf
[PDF] exercices maths 1ère sti2d
[PDF] exercice probabilité 1ere sti2d
[PDF] produit scalaire terminale sti2d
[PDF] cours 1ere sti2d physique
[PDF] exercice produit scalaire 1ere sti2d
[PDF] programme 1ere sti2d maths
[PDF] programme terminale sti2d physique
[PDF] programme terminale sti2d maths
Notes de cours - Statistique Descriptive
Licence Mathématiques et informatique appliquées aux sciences humaines et socialesUniversité de Bordeaux
UE : Bases en statistiques - Première année Licence MIASHSRédaction: Brigitte Patouille et Jérôme Poix
Enseignants impliqués dans l"UE
Jérémie Bigot, Marie Chavent, Vincent Couallier, Brigitte Patouille2016-2017
2Table des matières
1 Les données5
2 Statistique descriptive à une variable 7
2.1 Distribution statistique associée à un échantillon . . . . . . . . . . . . . . . . . . . . 7
2.2 Fréquence, effectif cumulé et fréquence cumulée . . . . . . . . . . . . . . . . . . . . . 9
2.3 Représentations graphiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3.1 Diagramme circulaire (camembert) . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3.2 Diagramme des effectifs et des fréquences . . . . . . . . . . . . . . . . . . . . 10
2.3.3 Diagrammes d"effectifs et de fréquences cumulés . . . . . . . . . . . . . . . . . 12
2.4 Paramètres caractérisant une variable statistique . . . . . . . . . . . . . . . . . . . . 14
2.4.1 Paramètres (ou indicateurs) de position (ou de centralité) . . . . . . . . . . . 14
2.4.2 Paramètres de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.4.3 Propriétés de la variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3 Statistique descriptive à deux variables 22
3.1 Distribution statistique d"un couple de variables . . . . . . . . . . . . . . . . . . . . . 22
3.2 Distributions conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2.1Yquantitative etXqualitative (ou quantitative) . . . . . . . . . . . . . . . . 24
3.2.2XetYqualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.3XetYquantitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3 41 Les données
Lesdonnées statistiquesse présentent sous la forme d"individuspour lesquels sont mesurés un certain nombre decaractères(ou"variables statistiques"). L"ensemble des individus constitue unéchantillon(ou encore unesérie statistique), formant ainsi un sous-ensemble d"un groupe (beaucoup) plus grand appelé"population". Les caractères statistiques peuvent être de plusieurs natures :Lesvariables qualitatives:
Exemples : nationalité d"une personne, profession. Les valeurs possibles d"une variable qualitative sont appelées lesmodalités; Exemples :"Français", "Britannique", "Professeur", "Médecin". Remarque :Certaines variables qualitatives peuvent parfois comporter un ordre "naturel" ;Exemple : variable "activité sportive" avec les modalités "peu sportif", "assez sportif", "très sportif".
Lesvariables quantitatives(qu"on peut mesurer);
- Lesvariables quantitatives discrètes: variables prenant leurs valeurs dans un ensemble fini ou dénombrable (en généralN); Exemples : âge d"une personne (en années), nombre d"enfants dans une famille. Pour ces variables, les valeurs possibles sont également appeléesmodalités. - Lesvariables quantitatives continues: variables qui peuvent prendren"importe quelle valeurdans un intervalle deR, c"est à dire mesurées avec une très grande précision. Exemples : taille d"un individu (en mm), poids (en g), temps d"une réaction chimique (en micro- secondes).En résumé :
Soit uncaractère statistiqueX.
Unéchantillon(ousérie statistique) pour ce caractère peut se représenter par la donnée d"une
suite de nombres : fx1;x2;:::;xng; où : -nest le nombre d"observations (ou encore lataille de l"échantillon) - et8i;1in,xireprésente la valeur du caractèreXpour l"individui. Les données présentées sous cette forme sont appelées lesdonnées brutes. On peut également les représenter sous la forme d"un tableau :IndividuX 1x 12x 2. ..nx nExemple de tableau de données à 4 individus et 3 variables : 5SexeNombre de frères et soeursTaille(cm)
1M1143
2M2149
3F0144
4F2146
Pour un tableau de données ànindividus etkvariables, on peut étudier les données de plusieurs
façons :-1 variable à la fois!statistique descriptive à 1 variable, étude d"un caractère statistique;
-2 variables à la fois!statistique descriptive à 2 variables, étudesimultanéede 2 carac- tères statistiques; -+ de 2 variables à la fois!statistique exploratoire, analyse des données (méthodes plus lourdes et plus complexes, calculs intensifs). 62 Statistique descriptive à une variable
2.1 Distribution statistique associée à un échantillon
Variables qualitatives ou quantitatives discrètes.Définition 1 :Une distribution statistique d"un échantillon denobservations d"une variable qua-
litative ou quantitative discrèteX(ou bien d"un caractère qualitatif ou quantitatif discret) est
constituée par la donnée d"un regroupement f(a1;n1);(a2;n2);:::;(ap;np)g; où : - lesai,1ipreprésentent les modalités de la variable statistiqueX(classées le plus souvent en ordre croissant,a1< a2<< ap),pétant le nombre de modalités; - le nombreni,1ip, appeléeffectif de la modalitéreprésente le nombre d"individus pour lesquels la variableXa la modalitéai,1ip. -pX i=1n i=n On peut représenter une distribution statistique discrète par un tableau :X(modalités)a 1a 2:::a pEffectifn 1n 2:::n pExemple :Données brutes Distribution statistique
(Données regroupéesou"triées à plat")iÂgexi120 218318
419
517
618
722
818
920
1018ÂgeEffectif
Variables quantitatives continues : deux approches possibles.Première approche :On peut considérer un échantillon d"un caractère continu comme celui d"un
caractère discret à valeur dans un sous-ensemble fini deR. !même définition de la distribution que dans le cas discret.X(modalités)a 1a 2:::a pEffectifn 1n 2:::n p7 On appellera cette distribution la"distribution empirique"du caractèreX.Mais si l"hypothèse de continuité du caractère est pertinente, alorsp'n, et (presque) tous les
effectifsniseront égaux à 1. On se retrouve donc avec les données brutes dans ce cas.!Les "modalités" sont les différentes valeurs prises par le caractère.Elles dépendent ici des
observations de l"échantillon. Remarque 1 :Cette définition de la distribution d"un caractère continu correspond seulement auclassement dans l"ordre croissant des données et au regroupement éventuel des quelques observations
qui pourraient être identiques.Seconde approche :Pour obtenir une représentation synthétique des données, on a besoin d"ef-
fectuer unregroupement en classes.Définition 2 :Une distribution statistique d"un échantillon denobservations d"une variable quan-
titative continue (ou d"un caractère quantitatif continu)Xregroupée en classesest constituée
par la donnée d"un regroupement f(C1;n1);(C2;n2);:::;(Cp;np)g; où : - lesCi,1ipsont des intervalles appelésclasseset formant une partition de l"ensemble des valeurs possibles pourX, c"est à dire C1= [a0;a1[; C2= [a1;a2[;:::; Cp= [ap1;ap[;
ou bien C1=]a0;a1]; C2=]a1;a2];:::; Cp=]ap1;ap];
aveca0< a1<< ap. - le nombreni,1ip, appeléeffectif de la classereprésente le nombre d"individus pour lesquels la valeur de la variableXest dans la classeCi,1ip.On peut représenter une distribution statistique continue par un tableau :X(classes)]a0;a1]]a1;a2]:::]ap1;ap]Effectifn
1n 2:::n pRemarque 2 :On a bien sûr pour un échantillon de taillen, n1+n2++np=n:
Remarque 3 :Quand on passe des données brutes à la distribution, il y a perte d"information,surtout dans le cas des variables continues, puisqu"on ne connaît plus les valeurs effectivement prises
par la variable.En résumé :
Echantillon
(données brutes)Distribution
Regroupement Regroupement
en modalités en classes (qual. ou quant. discret) (quant. continu) 8Exemples de distributions statistiques :
1. Groupe sanguin de 100 personnes (variable ..Groupe sanguinAOBAB
Effectif40331413
2. Nombre d"enfants dans 80 familles (
Nb d"enfantsEffectif
06 120227
317
46
53
61
3. Taille (en cm) de 24 individus (
154117111821
156117411841
157117621851
160117711861
163117911881
167218021911
170118111941
4. Poids (en kg) de 92 personnes (
Avec Regroupement/Découpage de classes :
Remarque 4 :Dans le cas continu, la distribution statistique dépend du choix des classes, qui est arbitraire. En pratique, les classes seront choisies de manière "raisonnable" : en fonction du nombre d"observations. en fonction de l"amplitude de l"échantillon = +grande valeur - (+petite valeur). pas trop petites (sinon à la limiteni= 0ouni= 1,8i: ce n"est plus un regroupement en classes!) pas trop grandes (sinon à la limite il ne reste qu"une ou deux classes : plus aucune information sur les données).On choisit souvent des classes de même amplitude, mais il est fréquent de regrouper des classes
d"effectifs trop faibles, et de couper des classes d"effectifs trop grands.2.2 Fréquence, effectif cumulé et fréquence cumulée
Définition 3 :Soitn=n1++npl"effectif total d"un échantillon. On appellefréquencede la modalitéai(ou de la classeCi) le nombre f i=nin 9 fiest la proportion des sujets de l"échantillon qui ont une modalité deXégale àai(ou qui sont
dans la classeCi). SiXest quantitative ou qualitative ordinale et que lesaisont classés par ordre croissant (a1< a2<< ap), on appelleeffectif cumuléde la modalitéai(ou de la classeCi) le nombre : N i=n1++ni=iX j=1n j N i=n1++niest le nombre de sujets de l"échantillon qui ont une modalité deXinférieure ouégale àai.
On appellefréquence cumuléede la modalitéai(ou de la classeCi) le nombre F i=Nin =f1++fi=iX j=1f j: Fiest la proportion des sujets de l"échantillon qui ont une modalité deXinférieure ou égale àai.
Ces deux dernières quantités n"ont pas de sens pour les variables purement qualitatives.Remarque 5 :Le nombreficalculé sur un échantillon de taillenest une estimation de la fréquence
pide la modalitéai(ou de la classeCi) pour l"ensemble de la population. On appellepila "fréquence
théorique" ou encore probabilité de la modalité ou classe en question. On peut montrer sous certaines conditions que (loi dite des "grands nombres") lim n!+1fi=pi2.3 Représentations graphiques
Elles représentent
les effectifs, les fréquences (tout type de variables), les effectifs cumulés, les fréquences cumulées (variables quantitatives ou ordinales), les valeurs d"un caractère statistique pour chaque individu.2.3.1 Diagramme circulaire (camembert)
Cette représentation graphique est à réserver aux variables (purement) qualitatives. On divise le disque enpsecteurs représentant les modalités(a1;a2;:::;ap)et proportionnels auxeffectifs correpondants(n1;n2;:::;np). L"angle (en degrés) du secteur représentant la modalitéai
quotesdbs_dbs15.pdfusesText_21