Les graphiques (2ème partie) PDF 19 nov. 2014 Représentation

Statistiques descriptives Cours

de variable les tableaux statistiques

3.2.1 - Représenter graphiquement les données

série à 1 ou 2 variables. 3.2.1.2 Représentation graphique de séries statistiques représenter aussi bien des variables qualitatives que quantitatives.

Graphisme en statistique : quelques bases

graphiques et les “clients” de la statistique sont de plus en plus Représentation de la distribution d'UNE variable quantitative. Une variable.

Les graphiques (2ème partie)

19 nov. 2014 Représentation d'un processus discret. La fonction plot() appliquée à une seule variable quantitative x de taille n (un objet de type ...

Variables Distributions et Représentation graphiques - Statistiques

nombre de pannes etc. Variables quantitatives continues. ? Une variable quantitative continue peut prendre n'importe quelle valeur sur un intervalle

Statistiques descriptives et exercices

représentation graphique et le calcul de résumés numériques. 2.6 Représentation d'une variable quantitative discrète par la courbe cumulative. . . . 19.

Représentations statistiques

1.2.2 Variables quantitatives. Variable quantitative : variable dont les modalités sont des 2.2 Représentations graphiques. 2.2.1 Variable qualitative.

Statistique descriptive Notes de cours

1.4.3 Autre représentation graphique : fonction de répartition empirique . . 8. 1.5 Les variables quantitatives suite .

Graphiques de base

Importance des représentations graphiques . Les grandes familles de fonctions graphiques On parle également de variables quantitatives elles sont.

[PDF] Variables Distributions et Représentation graphiques - Statistiques

? Une variable est de type quantitatif si elle peut être mesurée ou quantifiée ? Exemples: le poids la hauteur le revenu le nombre d'enfants le nombre de

[PDF] Chapitre 3 Statistiques descriptives : Présentation de données

Reconnaître les différents types de variables et savoir choisir le type de graphique Manier et représenter les effectifs et les fréquences cumulées

Les différents types de variables leurs représentations graphiques

Il existe principalement deux groupes de varia- bles : les variables quantitatives et les variables qualitatives qui peuvent être subdivisés en plusieurs sous-

[PDF] Représentations statistiques - Université Paul-Valéry

2 2 Représentations graphiques 2 2 1 Variable qualitative Dans ce cas on utilise souvent un diagramme en secteur Dans ce diagramme chaque modalité est

[PDF] Graphisme en statistique

Un diagramme temporel est une représentation graphique d'une série de données quantitatives en fonction de l'ordre dans lequel elles ont été récoltées Il

[PDF] Représenter graphiquement les données

Les données issues de séries statistiques doubles avec une variable qualitative l'autre quantitative sont représentées graphiquement par une série de courbes

[PDF] chapitre 2 les graphiques - Eléments de statistiques

Comme toute représentation ces graphiques doivent être : Il paraît pertinent de choisir une variable quantitative continue comme la

[PDF] Statistiques descriptives et exercices

Étude d'une variable statistique à une dimension Effectif partiel - effectif cumulé Fréquence partielle - Fréquence cumulée Représentation graphique

[PDF] Introduction `a la statistique univariée Les représentations graphiques

8 fév 2010 · Cette fiche comprend des exercices portant `a la fois sur les para- m`etres descriptifs et les représentations graphiques liés aux variables

[PDF] Chapitre II Représentations graphiques Couleur des roses dun

La représentation graphique dépend de la nature du caractère étudié : Caractère qualitatif Caractère quantitatif Caractère quantitatif discret Caractère

Quelle est la représentation graphique d'une variable quantitative ?
Le diagramme en bâtons est utilisé dans le cas d'une variable quantitative discrète (figure 4). Il repose sur le même principe que l'histogramme mais les rectangles sont remplacés par des segments (bâtons). Le principal avantage de ce diagramme est qu'il traduit le caractère « isolé » des valeurs.
Quelle est la représentation graphique d'une variable qualitative ?
La représentation graphique de la distribution des probabilités d'une variable qualitative fait appel à 2 types de graphique communément désigné sous les termes : diagramme en bâton et le diagramme circulaire.
Quels sont les différents types de représentation graphique ?
On peut utiliser différents types de graphiques pour diffuser de l'information, notamment :
le graphique à barres,le pictogramme,le graphique circulaire,le graphique linéaire,le nuage de points,l'histogramme.
La représentation graphique des effectifs d'une variable continue est appelé un histogramme.

Les graphiques (2ème partie)

Thibault LAURENT

19 Novembre 2014Ce document a été généré directement depuis RStudio en utilisant l"outil Markdown. La version .pdf se

trouve ici

Résumé

Dans cette deuxième partie, on présentera les graphiques du point de vue du statisticien. C"est pourquoi on

fera la distinction entre variable quantitative, variable qualitative, croisement entre 2 variables (quantita-

tive/quantitative, quantitative/qualitative, qualitative/qualitative), qui selon le cas, fait appel à un graphique

particulier.

Rappel

Avant de commencer, vous devez effectuer les opérations suivantes afin de disposer de tous les éléments

nécessaires à l"apprentissage de cet E-thème. 1.

Créer un dossier propre à cet E-thème et l"indiquer comme répertoire dans lequel vous allez travailler à

l"aide de la fonctionsetwd().setwd("Z:/Thibault Pro/cours 14-15/R/cours4") 2. Dans un sous répertoire nommé "Ressource", placer le fichier donnees.txt . Il contient la définition des

jeux de données utilisés au cours de cet E-thème. Le charger sous R avec la fonctionsource().source("Ressource/donnees.txt")

Pour vérifier que ledata.framenommédfa bien été chargé, utiliser la fonctionls():ls() ## [1] "df" "vec"

2. Graphiques pour la statistique descriptive

On a vu dans la section précédente la "logique" de programmation utilisée pour représenter des graphiques

sous R. On va s"intéresser dans cette section plus particulièrement aux fonctions graphiques disponibles sous

R utiles pour l"analyse statistique descriptive.

2.1. Analyse unidimensionnelle

a. Représentation d"un processus discretLa fonctionplot()appliquée à une seule variable quantitativexde taillen(un objet de typenumericou

integer) renvoie le graphique des valeurs dexpar rapport à leurs indices dans le vecteur (de 1 àn). Ce

graphique n"a pas trop d"intérêt si les observations sont indépendantes et identiquement distribuées (i.i.d).

En revanche, lorsqu"il s"agit de données issues d"un processus discret ou bien d"une série temporelle, ce type

de représentation peut être intéressant, car il permet de visualiser l"évolution de la série; par exemple, cela

peut permettre d"observer un changement de comportement.

Exemple

: dans une usine qui produit des puces électroniques, on suit par heure le nombre de puces

produites. Lorsque tout se passe bien, les machines ont été calibrées pour produire environ 1000 puces par

heure. Lorsqu"il y a une machine défectueuse, cela entraîne une baisse de la production. Pour repérer s"il y a

un problème dans la production, l"usine s"est fixée comme valeur seuil à ne pas franchir, la valeur 750. Nous

avons simulé une série statistique supposant reproduire un tel phénomène. Les 100 premières valeurs sont

simulées selon une loi de PoissonP(1000), puis nous avons simulé un incident tel que la production diminue

progressivement jusqu"à atteindre une loi de PoissonP(200). Une fois le problème réparé, la série repart sur

une loi de PoissonP(1000).# simulation de la série rpois(50,1000)) # représentation de la série (fonction haut-niveau) plot(x,xlab="indices de la série",ylab= "nombre de puces produites", type= "l" lty= 2 # valeur seuil (fonction bas-niveau) abline(h=750,lwd= 2,col= "red") # étiquette (fonction bas-niveau) text(50,750,"Valeur seuil à ne pas franchir" ,pos= 3,col= "red") # valeurs à problèmes ind<- 1 :length(x) points(ind[x<750],x[x<750],pch= 20,cex= 2,col= "red") 2

050100150200

200
400
600
800
1000
indices de la série nombre de puces produites Valeur seuil à ne pas franchirb. Représentation d"une série temporelle

Si les indices du processus discret sont remplacés par des dates, alors on parlera de série temporelle. Il existe

plusieurs façons de représenter une telle série dont nous allons présenter ici seulement le chronogramme. Pour

plus de détails sur l"étude des séries temporelles, on réfèrera le lecteur à l"ouvrage d"Yves Aragon paru en

2011, "Séries temporelles avec R" (

site web du livre

Exemple

: on a repris ici le tout premier exemple d"Aragon [2011] qui représente l"évolution de la population

française et aux Etats-Unis. On commence par charger le package associé au livre ainsi que les données :# chargement du package associé au livre

require("caschrono") # chargement des données de population data("popfr")

L"objetpopfrest de classetsqui contient la série des observations ainsi que les dates correspondantes. Pour

obtenir ces dates, on utilise la fonctiontime().class(popfr) ## [1] "ts"time(popfr) 3 ## Time Series: ## Start = 1846 ## End = 1951 ## Frequency = 0.2 ## [1] 1846 1851 1856 1861 1866 1871 1876 1881 1886 1891 1896 1901 1906 1911

## [15] 1916 1921 1926 1931 1936 1941 1946 1951Finalement, pour représenter le graphique d"un tel objet, l"idée est bien entendu de représenter les valeurs

de la série en ordonnées et les dates correspondantes en abscisses. Pour cela, on va utiliser une fonction

générique de la fonctionplot(). Unefonction génériqueest en quelque sorte une extension d"une fonction

connue afin d"utiliser le même nom de fonction, mais qui s"applique sur de nouvelles classes d"objets. Aussi,

la fonctionplot()vu précédémment peut s"appliquer sur différents type d"objet (dont la classets). Pour

connaître les fonctions génériques de la fonctionplot(), on utilise la fonctionmethods():methods(plot)

## [1] plot.aareg* plot.acf* ## [3] plot.agnes* plot.areg ## [5] plot.areg.boot plot.aregImpute ## [7] plot.arma* plot.bats ## [9] plot.biVar plot.clusGap* ## [11] plot.cox.zph* plot.curveRep ## [13] plot.data.frame* plot.decomposed.ts* ## [15] plot.default plot.dendrogram* ## [17] plot.density* plot.diana* ## [19] plot.drawPlot plot.ecdf ## [21] plot.ets plot.factor* ## [23] plot.forecast plot.formula* ## [25] plot.function plot.garch* ## [27] plot.gbayes plot.hclust* ## [29] plot.histogram* plot.HoltWinters* ## [31] plot.irts* plot.isoreg* ## [33] plot.lm* plot.medpolish* ## [35] plot.mforecast* plot.mlm* ## [37] plot.mona* plot.partition* ## [39] plot.ppr* plot.prcomp* ## [41] plot.princomp* plot.profile.nls* ## [43] plot.Quantile2 plot.rm.boot ## [45] plot.shingle* plot.silhouette* ## [47] plot.spec* plot.spline* ## [49] plot.splineforecast plot.stepfun ## [51] plot.stl* plot.summary.formula.response ## [53] plot.summary.formula.reverse plot.summaryM ## [55] plot.summaryP plot.summaryS ## [57] plot.survfit* plot.table* ## [59] plot.tbats plot.timeSeries* ## [61] plot.transcan plot.trellis* ## [63] plot.ts plot.tskernel* ## [65] plot.TukeyHSD* plot.varclus ## [67] plot.xyVector* plot.zoo ## Non-visible functions are asterisked 4

Remarque 1: les fonctions suivies d"un astérisque sont des fonctions non visibles, c"est-à-dire que leurs

codes ne s"affichent pas directement lorsqu"on tape leur nom dans la console. Pour afficher le code de ces

fonctions, il faut utiliser la fonctiongetAnywhere. Par exemple :getAnywhere(plot.acf)

Remarque 2

: on constate que le nombre de fonctions génériques de la fonctionplot()est très important.

Pour les appeler, on peut soit appeler la fonction par son nom complet (plot.ts()par exemple) ou simplement

par la commandeplot()(ce nombre varie selon les packages qui ont été installés sur les machines...).

Ici, on représente les deux séries temporelles dans la même fenêtre graphique en utilisant les commandes vues

dans la partie précédente. Pour utiliser la fonctionplot.ts(), il n"est pas nécessaire de mettre en abscisses les

dates et en ordonnées les valeurs car la fonctionplot.ts()s"en occupera elle-même.# paramètres graphiques

# appel de la fonction générique plot.ts plot.ts(popfr,xlab= ?année?,ylab= ?population?, main = "Population française, 1846-1951" plot(uspop,xlab= ?année?,ylab= ?population?, main = "Population des Etats-Unis, 1790-1970"

Population française, 1846-1951

année population

18601880190019201940

36
38
40

Population des Etats-Unis, 1790-1970

année population

1800185019001950

0 50
100
150

200par(op)

c. Représentation de lois de distribution "théoriques"Dans ce paragraphe, on montre comment représenter des lois de distribution théoriques. En général, on

scinde les lois de distributions en deux familles selon la nature de la variableX:

lorsqueXest discrète, c"est-à-dire qu"elle prend ses valeurs parmi un nombre fini ou dénombrable de

valeurs, les distributions les plus utilisés sont la loi binomiale (de paramètresnetp) et la loi de Poisson

(de paramètreλ).

lorsqueXest continue, c"est-à-dire que les valeurs possibles pourxsont dansR, les distributions les

plus connues sont : la loi de Laplace/Gauss (de paramètresμetσ), la loi de Fisher (de paramètresν1

etν2) et la loi de Student (de paramètrek).

Pour caractériser une loi de distribution, on utilise plus particulièrement deux outils qui peuvent être

représentés graphiquement :

la densité de probabilité (usuellement notéef). Dans R, les fonctions qui permettent de calculer ces

fonctions commencent par la lettredsuivi de l"abbréviation de la loi. Par exemple,dpois,dbinom, dnorm, etc.

•la fonction de répartition (usuellement notéeF). Dans R, les fonctions qui permettent de calculer ces

fonctions commencent par la lettrepsuivi de l"abbréviation de la loi. Par exemple,ppois,pbinom, pnorm, etc.

Selon la nature de la variableX, ces outils ne seront pas représentés de la même façon (voir exemples

ci-dessous). Pous plus d"informations, on se reportera à l"ouvrage de Saporta (1990) "Probabilités, Analyse

des données et Statistique".

Exemple 1

: représentation de la densité de probabilités de la loi de Poisson pour différentes valeurs de

λ. La fonctiondpois(x, lambda)renvoie la probabilité d"obtenir la valeur entièrexlorsqueX≂ P(λ).

CommeXne prend que des valeurs discrètes, on représente les probabilités d"obtenir une valeurxpar un

trait vertical (optiontype="h"de la fonctionplot()).# valeurs de x entières x<-seq(0,20,1) # paramètres de la fenêtre graphique op<-par(mfrow=c(2,2),oma= c(0.5,2,2,2), # on boucle pour faire varier le paramètre for(lambda inc(0.5,1,5,10)) {# à chaque valeur du paramètre, on représente la fonction densité théorique plot(x,dpois(x,lambda),type="h",main= bquote(lambda~paste("=",.(lambda))), lwd= 2 ylab= "P[X=x]" col= "royalblue" par(op) title("Densité de probabilité : loi de Poisson",line = - 1,outer= TRUE) 6

05101520

0.0 0.2 0.4 0.6 l =0.5 x

P[X=x]

05101520

0.0 0.1 0.2 0.3 l =1 x

P[X=x]

05101520

0.00 0.10 l =5

P[X=x]

05101520

0.00 0.06 0.12 l =10

P[X=x]

Densité de probabilité : loi de PoissonExemple 2

: représentation de la densité de probabilités de la loi de Gauss/Laplace pour différentes valeurs

de(μ,σ). La fonctiondnorm(x, mean = , sd = )renvoie la valeur de la fonction de densitéfXau niveau

de la valeurxlorsqueX≂ N(μ,σ2). CommeXest continue,fXexiste pour toutx?R. On représente ici

cette fonction pour différentes valeurs deμetσavec un trait continu (optiontype="l"de la fonctionplot())# discrétisation de x

x<-seq(-5,5,0.1) # paramètres de la fenêtre graphique op<-par(mfrow=c(2,3),oma= c(0.5,2,2,2), # on boucle pour faire varier les paramètres for(sigma inc(1,2)) {for(mu inc(-1,0,2)) {# à chaque couple de paramètres, on représente la fonction densité théorique plot(x,dnorm(x,mu,sigma),type="l",lwd=2,ylab= "f",col= "royalblue", main=bquote(mu~paste("=",.(mu)," et")~sigma~paste("=",.(sigma)))) par(op) title("Densité de probabilité : loi de Gauss/Laplace",line = - 1,outer= TRUE) 7 -4-2024 0.0 0.1 0.2 0.3 0.4 m =-1 et s =1 x f -4-2024 0.0 0.1 0.2 0.3 0.4 m =0 et s =1 x f -4-2024 0.0 0.1 0.2 0.3 0.4 m =2 et s =1 x f -4-2024 0.00 0.05 0.10 0.15 0.20 m =-1 et s =2 f -4-2024 0.05 0.10 0.15 0.20 m =0 et s =2 f -4-2024 0.00 0.05 0.10 0.15 0.20 m =2 et s =2 f Densité de probabilité : loi de Gauss/LaplaceExemple 3

: représentation de la fonction de répartition de la loi de Poisson pour différentes valeurs de

λ. La fonctionppois(q, lambda)renvoie la probabilité d"obtenir une valeur inférieure ou égale à la valeur

entièrexlorsqueX≂ P(λ). CommeXest discrète, la forme de la fonction de répartition est en escalier

(optiontype="s"de la fonctionplot()) :x<-seq(0,20,1) op<-par(mfrow=c(2,2),oma= c(0.5,2,2,2), for(lambda inc(0.5,1,5,10)) plot(x,ppois(x,lambda),type="s",main= bquote(lambda~paste("=",.(lambda))), pch= 16 lwd= 2 ylab= "F(x)" col= "royalblue" points(x,ppois(x,lambda),col = "royalblue" ,pch= 16) par(op) title("Fonction de répartition : loi de Poisson") 8

05101520

0.6 0.8 1.0 l =0.5 x F(x)

05101520

0.4 0.6 0.8 1.0 l =1 x F(x)

05101520

0.0 0.4 0.8 l =5 F(x)

05101520

0.0 0.4 0.8 l =10 F(x) Fonction de répartition : loi de PoissonExemple 4

: représentation de la fonction de répartition de la loi de Laplace/Gauss pour différentes valeurs

de(μ,σ). La fonctionpnorm(x, mean = , sd = )renvoie la probabilité d"obtenir une valeur inférieure ou

égale à la valeurxlorsqueX≂ N(μ,σ2). CommeXest continue, la courbe est également continue :x<-seq(-5,5,0.1)

op<-par(mfrow=c(2,3),oma= c(0.5,2,2,2), for(sigma inc(1,2)) {for(mu inc(-1,0,2)) {plot(x,pnorm(x,mu,sigma),type="l",lwd=2,ylab= "F(x)",col= "royalblue", main=bquote(mu~paste("=",.(mu)," et")~sigma~paste("=",.(sigma)))) par(op) title("Fonction de répartition : loi de Gauss/Laplace",line = - 1,outer= TRUE) 9 -4-2024 0.0 0.2 0.4 0.6 0.8 1.0 m =-1 et s =1 x F(x) -4-2024 0.0 0.2 0.4 0.6 0.8 1.0 m =0 et s =1 x F(x) -4-2024 0.0 0.2 0.4 0.6 0.8 1.0 m =2 et s =1 x F(x) -4-2024 0.0 0.2 0.4 0.6 0.8 1.0 m =-1 et s =2 F(x) -4-2024 0.0 0.2 0.4 0.6 0.8 1.0 m =0 et s =2 F(x) -4-2024 0.0 0.2 0.4 0.6 0.8 m =2 et s =2 F(x)

Fonction de répartition : loi de Gauss/Laplaced. Représentation d"une variable quantitative discrète

Pour faire un résumé d"une variable quantitative discrète, on peut réaliser un tableau de fréquences. Reprenons

le jeu de donnéesdfsur lequel on enlève les observations dont la variableTrHvaut0h-24h.df.new<-df[df$TrH!="0h-24h",]

On rappelle que les observations sont des nombres qui comptabilisent combien de voitures sont passées au feu

vert, au feu orange, rouge après 1, 2, 3 secondes, etc. sur différents feux, à différents horaires, etc. Le nombre

d"observations est :nrow(df.new) ## [1] 72

Remarque

: lorsqu"on demande d"afficher le nombre de modalités que contient la variableTrH, on en trouve

toujours 5 alors qu"on vient d"enlever la modalité0h-24h. On décide donc de redéfinir la variableTrHpour

qu"elle ne contienne que les 4 modalités qui nous intéressent :levels(df.new$TrH) ## [1] "7h30-8h30" "0h-24h" "16h-18h" "12h-14h" "0h-6h" 10 df.new$TrH<-factor(df.new$TrH) levels(df.new$TrH)

## [1] "7h30-8h30" "16h-18h" "12h-14h" "0h-6h"La variableRO3est le nombre de voitures qui sont passées au feu rouge après 3 secondes. Une façon de

savoir combien il y a de valeurs distintes est d"utiliser la fonctionunique(), couplée avec la fonctionlength():length(unique(df.new$RO3))

## [1] 8

On constate donc que ce sont souvent les mêmes valeurs qui reviennent : il existe un nombre fini de valeurs

possibles pour cette variable qu"on peut donc considérer comme discrète. On résume cette variable par un

tableau de fréquences absolues et/ou relatives :valeurs effectifs proportion

0 22 0.3055556

1 17 0.2361111

2 14 0.1944444

3 11 0.1527778

4 3 0.0416667

5 2 0.0277778

6 2 0.0277778

8 1 0.0138889L"outil graphique qui permet de représenter un tel tableau est le diagramme en bâtons :

# on construit le tableau des effectifs tab<-table(df.new$RO3) # pour représenter les proportions, on utilise prop.table() plot(prop.table(tab),xlab= "valeurs observées",ylab= "proportions") title("Diagramme en bâtons") 11 0.00 0.10 0.20quotesdbs_dbs44.pdfusesText_44

[PDF] principe d'autonomie en ethique

[PDF] autonomie du patient hospitalisé

[PDF] histogramme sous r

[PDF] principe d'autonomie du patient

[PDF] graphique r studio

[PDF] principe de bienfaisance éthique

[PDF] graphique sous r

[PDF] principe d'autonomie définition

[PDF] courbe r

[PDF] autonomie décisionnelle définition

[PDF] diagramme en baton r

[PDF] barplot sur r

[PDF] autonomie du patient définition

[PDF] barplot sous r

[PDF] autonomie du patient loi

[PDF] Les graphiques (2ème partie) 19 nov. 2014 Représentation

Quelle est la représentation graphique d'une variable quantitative ?

Quelle est la représentation graphique d'une variable qualitative ?

Quels sont les différents types de représentation graphique ?

On peut utiliser différents types de graphiques pour diffuser de l'information, notamment :

Les graphiques (2ème partie)

Thibault LAURENT

19 Novembre 2014Ce document a été généré directement depuis RStudio en utilisant l"outil Markdown. La version .pdf se

Résumé

Rappel

2. Graphiques pour la statistique descriptive

R utiles pour l"analyse statistique descriptive.

2.1. Analyse unidimensionnelle

Exemple

050100150200

2011, "Séries temporelles avec R" (

Exemple

Remarque 2

Population française, 1846-1951

18601880190019201940

Population des Etats-Unis, 1790-1970

1800185019001950

200par(op)

Exemple 1

05101520

P[X=x]

05101520

P[X=x]

05101520

P[X=x]

05101520

P[X=x]

05101520

05101520

05101520

05101520

Remarque

0 22 0.3055556

1 17 0.2361111

2 14 0.1944444

3 11 0.1527778

4 3 0.0416667

5 2 0.0277778

6 2 0.0277778

8 1 0.0138889L"outil graphique qui permet de représenter un tel tableau est le diagramme en bâtons :