Statistiques descriptives Cours
de variable les tableaux statistiques
3.2.1 - Représenter graphiquement les données
série à 1 ou 2 variables. 3.2.1.2 Représentation graphique de séries statistiques représenter aussi bien des variables qualitatives que quantitatives.
Graphisme en statistique : quelques bases
graphiques et les “clients” de la statistique sont de plus en plus Représentation de la distribution d'UNE variable quantitative. Une variable.
Les graphiques (2ème partie)
19 nov. 2014 Représentation d'un processus discret. La fonction plot() appliquée à une seule variable quantitative x de taille n (un objet de type ...
Variables Distributions et Représentation graphiques - Statistiques
nombre de pannes etc. Variables quantitatives continues. ? Une variable quantitative continue peut prendre n'importe quelle valeur sur un intervalle
Statistiques descriptives et exercices
représentation graphique et le calcul de résumés numériques. 2.6 Représentation d'une variable quantitative discrète par la courbe cumulative. . . . 19.
SEMIOLOGIE GRAPHIQUE
données SIG
Représentations statistiques
1.2.2 Variables quantitatives. Variable quantitative : variable dont les modalités sont des 2.2 Représentations graphiques. 2.2.1 Variable qualitative.
Statistique descriptive Notes de cours
1.4.3 Autre représentation graphique : fonction de répartition empirique . . 8. 1.5 Les variables quantitatives suite .
Graphiques de base
Importance des représentations graphiques . Les grandes familles de fonctions graphiques On parle également de variables quantitatives elles sont.
[PDF] Variables Distributions et Représentation graphiques - Statistiques
? Une variable est de type quantitatif si elle peut être mesurée ou quantifiée ? Exemples: le poids la hauteur le revenu le nombre d'enfants le nombre de
[PDF] Chapitre 3 Statistiques descriptives : Présentation de données
Reconnaître les différents types de variables et savoir choisir le type de graphique Manier et représenter les effectifs et les fréquences cumulées
Les différents types de variables leurs représentations graphiques
Il existe principalement deux groupes de varia- bles : les variables quantitatives et les variables qualitatives qui peuvent être subdivisés en plusieurs sous-
[PDF] Représentations statistiques - Université Paul-Valéry
2 2 Représentations graphiques 2 2 1 Variable qualitative Dans ce cas on utilise souvent un diagramme en secteur Dans ce diagramme chaque modalité est
[PDF] Graphisme en statistique
Un diagramme temporel est une représentation graphique d'une série de données quantitatives en fonction de l'ordre dans lequel elles ont été récoltées Il
[PDF] Représenter graphiquement les données
Les données issues de séries statistiques doubles avec une variable qualitative l'autre quantitative sont représentées graphiquement par une série de courbes
[PDF] chapitre 2 les graphiques - Eléments de statistiques
Comme toute représentation ces graphiques doivent être : Il paraît pertinent de choisir une variable quantitative continue comme la
[PDF] Statistiques descriptives et exercices
Étude d'une variable statistique à une dimension Effectif partiel - effectif cumulé Fréquence partielle - Fréquence cumulée Représentation graphique
[PDF] Introduction `a la statistique univariée Les représentations graphiques
8 fév 2010 · Cette fiche comprend des exercices portant `a la fois sur les para- m`etres descriptifs et les représentations graphiques liés aux variables
[PDF] Chapitre II Représentations graphiques Couleur des roses dun
La représentation graphique dépend de la nature du caractère étudié : Caractère qualitatif Caractère quantitatif Caractère quantitatif discret Caractère
Quelle est la représentation graphique d'une variable quantitative ?
Le diagramme en bâtons est utilisé dans le cas d'une variable quantitative discrète (figure 4). Il repose sur le même principe que l'histogramme mais les rectangles sont remplacés par des segments (bâtons). Le principal avantage de ce diagramme est qu'il traduit le caractère « isolé » des valeurs.Quelle est la représentation graphique d'une variable qualitative ?
La représentation graphique de la distribution des probabilités d'une variable qualitative fait appel à 2 types de graphique communément désigné sous les termes : diagramme en bâton et le diagramme circulaire.Quels sont les différents types de représentation graphique ?
On peut utiliser différents types de graphiques pour diffuser de l'information, notamment :
le graphique à barres,le pictogramme,le graphique circulaire,le graphique linéaire,le nuage de points,l'histogramme.- La représentation graphique des effectifs d'une variable continue est appelé un histogramme.
Les graphiques (2ème partie)
Thibault LAURENT
19 Novembre 2014Ce document a été généré directement depuis RStudio en utilisant l"outil Markdown. La version .pdf se
trouve iciRésumé
Dans cette deuxième partie, on présentera les graphiques du point de vue du statisticien. C"est pourquoi on
fera la distinction entre variable quantitative, variable qualitative, croisement entre 2 variables (quantita-
tive/quantitative, quantitative/qualitative, qualitative/qualitative), qui selon le cas, fait appel à un graphique
particulier.Rappel
Avant de commencer, vous devez effectuer les opérations suivantes afin de disposer de tous les éléments
nécessaires à l"apprentissage de cet E-thème. 1.Créer un dossier propre à cet E-thème et l"indiquer comme répertoire dans lequel vous allez travailler à
l"aide de la fonctionsetwd().setwd("Z:/Thibault Pro/cours 14-15/R/cours4") 2. Dans un sous répertoire nommé "Ressource", placer le fichier donnees.txt . Il contient la définition desjeux de données utilisés au cours de cet E-thème. Le charger sous R avec la fonctionsource().source("Ressource/donnees.txt")
Pour vérifier que ledata.framenommédfa bien été chargé, utiliser la fonctionls():ls() ## [1] "df" "vec"2. Graphiques pour la statistique descriptive
On a vu dans la section précédente la "logique" de programmation utilisée pour représenter des graphiques
sous R. On va s"intéresser dans cette section plus particulièrement aux fonctions graphiques disponibles sous
R utiles pour l"analyse statistique descriptive.
12.1. Analyse unidimensionnelle
a. Représentation d"un processus discretLa fonctionplot()appliquée à une seule variable quantitativexde taillen(un objet de typenumericou
integer) renvoie le graphique des valeurs dexpar rapport à leurs indices dans le vecteur (de 1 àn). Ce
graphique n"a pas trop d"intérêt si les observations sont indépendantes et identiquement distribuées (i.i.d).
En revanche, lorsqu"il s"agit de données issues d"un processus discret ou bien d"une série temporelle, ce type
de représentation peut être intéressant, car il permet de visualiser l"évolution de la série; par exemple, cela
peut permettre d"observer un changement de comportement.Exemple
: dans une usine qui produit des puces électroniques, on suit par heure le nombre de pucesproduites. Lorsque tout se passe bien, les machines ont été calibrées pour produire environ 1000 puces par
heure. Lorsqu"il y a une machine défectueuse, cela entraîne une baisse de la production. Pour repérer s"il y a
un problème dans la production, l"usine s"est fixée comme valeur seuil à ne pas franchir, la valeur 750. Nous
avons simulé une série statistique supposant reproduire un tel phénomène. Les 100 premières valeurs sont
simulées selon une loi de PoissonP(1000), puis nous avons simulé un incident tel que la production diminue
progressivement jusqu"à atteindre une loi de PoissonP(200). Une fois le problème réparé, la série repart sur
une loi de PoissonP(1000).# simulation de la série rpois(50,1000)) # représentation de la série (fonction haut-niveau) plot(x,xlab="indices de la série",ylab= "nombre de puces produites", type= "l" lty= 2 # valeur seuil (fonction bas-niveau) abline(h=750,lwd= 2,col= "red") # étiquette (fonction bas-niveau) text(50,750,"Valeur seuil à ne pas franchir" ,pos= 3,col= "red") # valeurs à problèmes ind<- 1 :length(x) points(ind[x<750],x[x<750],pch= 20,cex= 2,col= "red") 2050100150200
200400
600
800
1000
indices de la série nombre de puces produites Valeur seuil à ne pas franchirb. Représentation d"une série temporelle
Si les indices du processus discret sont remplacés par des dates, alors on parlera de série temporelle. Il existe
plusieurs façons de représenter une telle série dont nous allons présenter ici seulement le chronogramme. Pour
plus de détails sur l"étude des séries temporelles, on réfèrera le lecteur à l"ouvrage d"Yves Aragon paru en
2011, "Séries temporelles avec R" (
site web du livreExemple
: on a repris ici le tout premier exemple d"Aragon [2011] qui représente l"évolution de la population
française et aux Etats-Unis. On commence par charger le package associé au livre ainsi que les données :# chargement du package associé au livre
require("caschrono") # chargement des données de population data("popfr")L"objetpopfrest de classetsqui contient la série des observations ainsi que les dates correspondantes. Pour
obtenir ces dates, on utilise la fonctiontime().class(popfr) ## [1] "ts"time(popfr) 3 ## Time Series: ## Start = 1846 ## End = 1951 ## Frequency = 0.2 ## [1] 1846 1851 1856 1861 1866 1871 1876 1881 1886 1891 1896 1901 1906 1911## [15] 1916 1921 1926 1931 1936 1941 1946 1951Finalement, pour représenter le graphique d"un tel objet, l"idée est bien entendu de représenter les valeurs
de la série en ordonnées et les dates correspondantes en abscisses. Pour cela, on va utiliser une fonction
générique de la fonctionplot(). Unefonction génériqueest en quelque sorte une extension d"une fonction
connue afin d"utiliser le même nom de fonction, mais qui s"applique sur de nouvelles classes d"objets. Aussi,
la fonctionplot()vu précédémment peut s"appliquer sur différents type d"objet (dont la classets). Pour
connaître les fonctions génériques de la fonctionplot(), on utilise la fonctionmethods():methods(plot)
## [1] plot.aareg* plot.acf* ## [3] plot.agnes* plot.areg ## [5] plot.areg.boot plot.aregImpute ## [7] plot.arma* plot.bats ## [9] plot.biVar plot.clusGap* ## [11] plot.cox.zph* plot.curveRep ## [13] plot.data.frame* plot.decomposed.ts* ## [15] plot.default plot.dendrogram* ## [17] plot.density* plot.diana* ## [19] plot.drawPlot plot.ecdf ## [21] plot.ets plot.factor* ## [23] plot.forecast plot.formula* ## [25] plot.function plot.garch* ## [27] plot.gbayes plot.hclust* ## [29] plot.histogram* plot.HoltWinters* ## [31] plot.irts* plot.isoreg* ## [33] plot.lm* plot.medpolish* ## [35] plot.mforecast* plot.mlm* ## [37] plot.mona* plot.partition* ## [39] plot.ppr* plot.prcomp* ## [41] plot.princomp* plot.profile.nls* ## [43] plot.Quantile2 plot.rm.boot ## [45] plot.shingle* plot.silhouette* ## [47] plot.spec* plot.spline* ## [49] plot.splineforecast plot.stepfun ## [51] plot.stl* plot.summary.formula.response ## [53] plot.summary.formula.reverse plot.summaryM ## [55] plot.summaryP plot.summaryS ## [57] plot.survfit* plot.table* ## [59] plot.tbats plot.timeSeries* ## [61] plot.transcan plot.trellis* ## [63] plot.ts plot.tskernel* ## [65] plot.TukeyHSD* plot.varclus ## [67] plot.xyVector* plot.zoo ## Non-visible functions are asterisked 4Remarque 1: les fonctions suivies d"un astérisque sont des fonctions non visibles, c"est-à-dire que leurs
codes ne s"affichent pas directement lorsqu"on tape leur nom dans la console. Pour afficher le code de ces
fonctions, il faut utiliser la fonctiongetAnywhere. Par exemple :getAnywhere(plot.acf)Remarque 2
: on constate que le nombre de fonctions génériques de la fonctionplot()est très important.Pour les appeler, on peut soit appeler la fonction par son nom complet (plot.ts()par exemple) ou simplement
par la commandeplot()(ce nombre varie selon les packages qui ont été installés sur les machines...).
Ici, on représente les deux séries temporelles dans la même fenêtre graphique en utilisant les commandes vues
dans la partie précédente. Pour utiliser la fonctionplot.ts(), il n"est pas nécessaire de mettre en abscisses les
dates et en ordonnées les valeurs car la fonctionplot.ts()s"en occupera elle-même.# paramètres graphiques
# appel de la fonction générique plot.ts plot.ts(popfr,xlab= ?année?,ylab= ?population?, main = "Population française, 1846-1951" plot(uspop,xlab= ?année?,ylab= ?population?, main = "Population des Etats-Unis, 1790-1970"Population française, 1846-1951
année population18601880190019201940
3638
40
Population des Etats-Unis, 1790-1970
année population1800185019001950
0 50100
150
200par(op)
5c. Représentation de lois de distribution "théoriques"Dans ce paragraphe, on montre comment représenter des lois de distribution théoriques. En général, on
scinde les lois de distributions en deux familles selon la nature de la variableX:lorsqueXest discrète, c"est-à-dire qu"elle prend ses valeurs parmi un nombre fini ou dénombrable de
valeurs, les distributions les plus utilisés sont la loi binomiale (de paramètresnetp) et la loi de Poisson
(de paramètreλ).lorsqueXest continue, c"est-à-dire que les valeurs possibles pourxsont dansR, les distributions les
plus connues sont : la loi de Laplace/Gauss (de paramètresμetσ), la loi de Fisher (de paramètresν1
etν2) et la loi de Student (de paramètrek).Pour caractériser une loi de distribution, on utilise plus particulièrement deux outils qui peuvent être
représentés graphiquement :la densité de probabilité (usuellement notéef). Dans R, les fonctions qui permettent de calculer ces
fonctions commencent par la lettredsuivi de l"abbréviation de la loi. Par exemple,dpois,dbinom, dnorm, etc.•la fonction de répartition (usuellement notéeF). Dans R, les fonctions qui permettent de calculer ces
fonctions commencent par la lettrepsuivi de l"abbréviation de la loi. Par exemple,ppois,pbinom, pnorm, etc.Selon la nature de la variableX, ces outils ne seront pas représentés de la même façon (voir exemples
ci-dessous). Pous plus d"informations, on se reportera à l"ouvrage de Saporta (1990) "Probabilités, Analyse
des données et Statistique".Exemple 1
: représentation de la densité de probabilités de la loi de Poisson pour différentes valeurs de
λ. La fonctiondpois(x, lambda)renvoie la probabilité d"obtenir la valeur entièrexlorsqueX≂ P(λ).
CommeXne prend que des valeurs discrètes, on représente les probabilités d"obtenir une valeurxpar un
trait vertical (optiontype="h"de la fonctionplot()).# valeurs de x entières x<-seq(0,20,1) # paramètres de la fenêtre graphique op<-par(mfrow=c(2,2),oma= c(0.5,2,2,2), # on boucle pour faire varier le paramètre for(lambda inc(0.5,1,5,10)) {# à chaque valeur du paramètre, on représente la fonction densité théorique plot(x,dpois(x,lambda),type="h",main= bquote(lambda~paste("=",.(lambda))), lwd= 2 ylab= "P[X=x]" col= "royalblue" par(op) title("Densité de probabilité : loi de Poisson",line = - 1,outer= TRUE) 605101520
0.0 0.2 0.4 0.6 l =0.5 xP[X=x]
05101520
0.0 0.1 0.2 0.3 l =1 xP[X=x]
05101520
0.00 0.10 l =5P[X=x]
05101520
0.00 0.06 0.12 l =10P[X=x]
Densité de probabilité : loi de PoissonExemple 2: représentation de la densité de probabilités de la loi de Gauss/Laplace pour différentes valeurs
de(μ,σ). La fonctiondnorm(x, mean = , sd = )renvoie la valeur de la fonction de densitéfXau niveau
de la valeurxlorsqueX≂ N(μ,σ2). CommeXest continue,fXexiste pour toutx?R. On représente ici
cette fonction pour différentes valeurs deμetσavec un trait continu (optiontype="l"de la fonctionplot())# discrétisation de x
x<-seq(-5,5,0.1) # paramètres de la fenêtre graphique op<-par(mfrow=c(2,3),oma= c(0.5,2,2,2), # on boucle pour faire varier les paramètres for(sigma inc(1,2)) {for(mu inc(-1,0,2)) {# à chaque couple de paramètres, on représente la fonction densité théorique plot(x,dnorm(x,mu,sigma),type="l",lwd=2,ylab= "f",col= "royalblue", main=bquote(mu~paste("=",.(mu)," et")~sigma~paste("=",.(sigma)))) par(op) title("Densité de probabilité : loi de Gauss/Laplace",line = - 1,outer= TRUE) 7 -4-2024 0.0 0.1 0.2 0.3 0.4 m =-1 et s =1 x f -4-2024 0.0 0.1 0.2 0.3 0.4 m =0 et s =1 x f -4-2024 0.0 0.1 0.2 0.3 0.4 m =2 et s =1 x f -4-2024 0.00 0.05 0.10 0.15 0.20 m =-1 et s =2 f -4-2024 0.05 0.10 0.15 0.20 m =0 et s =2 f -4-2024 0.00 0.05 0.10 0.15 0.20 m =2 et s =2 f Densité de probabilité : loi de Gauss/LaplaceExemple 3: représentation de la fonction de répartition de la loi de Poisson pour différentes valeurs de
λ. La fonctionppois(q, lambda)renvoie la probabilité d"obtenir une valeur inférieure ou égale à la valeur
entièrexlorsqueX≂ P(λ). CommeXest discrète, la forme de la fonction de répartition est en escalier
(optiontype="s"de la fonctionplot()) :x<-seq(0,20,1) op<-par(mfrow=c(2,2),oma= c(0.5,2,2,2), for(lambda inc(0.5,1,5,10)) plot(x,ppois(x,lambda),type="s",main= bquote(lambda~paste("=",.(lambda))), pch= 16 lwd= 2 ylab= "F(x)" col= "royalblue" points(x,ppois(x,lambda),col = "royalblue" ,pch= 16) par(op) title("Fonction de répartition : loi de Poisson") 805101520
0.6 0.8 1.0 l =0.5 x F(x)05101520
0.4 0.6 0.8 1.0 l =1 x F(x)05101520
0.0 0.4 0.8 l =5 F(x)05101520
0.0 0.4 0.8 l =10 F(x) Fonction de répartition : loi de PoissonExemple 4: représentation de la fonction de répartition de la loi de Laplace/Gauss pour différentes valeurs
de(μ,σ). La fonctionpnorm(x, mean = , sd = )renvoie la probabilité d"obtenir une valeur inférieure ou
égale à la valeurxlorsqueX≂ N(μ,σ2). CommeXest continue, la courbe est également continue :x<-seq(-5,5,0.1)
op<-par(mfrow=c(2,3),oma= c(0.5,2,2,2), for(sigma inc(1,2)) {for(mu inc(-1,0,2)) {plot(x,pnorm(x,mu,sigma),type="l",lwd=2,ylab= "F(x)",col= "royalblue", main=bquote(mu~paste("=",.(mu)," et")~sigma~paste("=",.(sigma)))) par(op) title("Fonction de répartition : loi de Gauss/Laplace",line = - 1,outer= TRUE) 9 -4-2024 0.0 0.2 0.4 0.6 0.8 1.0 m =-1 et s =1 x F(x) -4-2024 0.0 0.2 0.4 0.6 0.8 1.0 m =0 et s =1 x F(x) -4-2024 0.0 0.2 0.4 0.6 0.8 1.0 m =2 et s =1 x F(x) -4-2024 0.0 0.2 0.4 0.6 0.8 1.0 m =-1 et s =2 F(x) -4-2024 0.0 0.2 0.4 0.6 0.8 1.0 m =0 et s =2 F(x) -4-2024 0.0 0.2 0.4 0.6 0.8 m =2 et s =2 F(x)Fonction de répartition : loi de Gauss/Laplaced. Représentation d"une variable quantitative discrète
Pour faire un résumé d"une variable quantitative discrète, on peut réaliser un tableau de fréquences. Reprenons
le jeu de donnéesdfsur lequel on enlève les observations dont la variableTrHvaut0h-24h.df.new<-df[df$TrH!="0h-24h",]
On rappelle que les observations sont des nombres qui comptabilisent combien de voitures sont passées au feu
vert, au feu orange, rouge après 1, 2, 3 secondes, etc. sur différents feux, à différents horaires, etc. Le nombre
d"observations est :nrow(df.new) ## [1] 72Remarque
: lorsqu"on demande d"afficher le nombre de modalités que contient la variableTrH, on en trouvetoujours 5 alors qu"on vient d"enlever la modalité0h-24h. On décide donc de redéfinir la variableTrHpour
qu"elle ne contienne que les 4 modalités qui nous intéressent :levels(df.new$TrH) ## [1] "7h30-8h30" "0h-24h" "16h-18h" "12h-14h" "0h-6h" 10 df.new$TrH<-factor(df.new$TrH) levels(df.new$TrH)## [1] "7h30-8h30" "16h-18h" "12h-14h" "0h-6h"La variableRO3est le nombre de voitures qui sont passées au feu rouge après 3 secondes. Une façon de
savoir combien il y a de valeurs distintes est d"utiliser la fonctionunique(), couplée avec la fonctionlength():length(unique(df.new$RO3))
## [1] 8On constate donc que ce sont souvent les mêmes valeurs qui reviennent : il existe un nombre fini de valeurs
possibles pour cette variable qu"on peut donc considérer comme discrète. On résume cette variable par un
tableau de fréquences absolues et/ou relatives :valeurs effectifs proportion0 22 0.3055556
1 17 0.2361111
2 14 0.1944444
3 11 0.1527778
4 3 0.0416667
5 2 0.0277778
6 2 0.0277778
8 1 0.0138889L"outil graphique qui permet de représenter un tel tableau est le diagramme en bâtons :
# on construit le tableau des effectifs tab<-table(df.new$RO3) # pour représenter les proportions, on utilise prop.table() plot(prop.table(tab),xlab= "valeurs observées",ylab= "proportions") title("Diagramme en bâtons") 11 0.00 0.10 0.20quotesdbs_dbs44.pdfusesText_44[PDF] autonomie du patient hospitalisé
[PDF] histogramme sous r
[PDF] principe d'autonomie du patient
[PDF] graphique r studio
[PDF] principe de bienfaisance éthique
[PDF] graphique sous r
[PDF] principe d'autonomie définition
[PDF] courbe r
[PDF] autonomie décisionnelle définition
[PDF] diagramme en baton r
[PDF] barplot sur r
[PDF] autonomie du patient définition
[PDF] barplot sous r
[PDF] autonomie du patient loi