[PDF] Histogramme et courbe de densité de Kernel





Previous PDF Next PDF



Construction dun histogramme

à son effectif ou sa fréquence. Construire l'histogramme correspondant à cette série (largeur constante) : Taille en cm.



TD n°1 de Statistiques : histogrammes CORRECTION

l'histogramme des effectifs (constitué de rectangles contigus). Les classes ayant la même amplitude on peut graduer l'axe vertical. Nous avons tracé les 



statistiques corrigé

Tableaux d'effectifs de fréquences : 1. Calculer la fréquence d'une valeur ou d'une classe : Diviser l'effectif de la valeur par l'effectif total ? fréquence.



2nde : TD histogramme et polygone des F.C.C

sa fréquence). Exercice 1 (largeur constante). Construire l'histogramme correspondant à cette série (largeur constante) : Taille en cm.



STATISTIQUE AVEC EXCEL

(B) Calculer la moyenne la variance et l'écart type. (C) Construire l'histogramme des effectifs. (D) Construire le polygone des fréquences cumulées.



Histogramme et courbe de densité de Kernel

13 avr. 2015 On peut choisir de construire l'histogramme avec des fréquences relatives au lieu des fréquences simples grâce à l'argument freq.



TP2 : Analyse de données quantitatives avec le logiciel R

pouvez résumer ces données sous la forme d'un tableau de fréquences. Le problème de l'histogramme est la définition des classes.



Statistiques descriptives et exercices

3.2.1 Histogramme des fréquences (ou effectifs) . Construire la table des fréquences et le diagramme en bâtons en fréquences de la série.



Chapitre 3. Statistiques descriptives : Présentation de données

de graphique approprié. Lire et construire des histogrammes. Manier et représenter les effectifs et les fréquences cumulées. Plan du cours.



Séminaire de formation sur les statistiques des pêches - Notes de

Cette distribution de fréquence résume 1 870 observations en 9 classes et un total. Pour construire un histogramme de fréquence on respectera les.



[PDF] Construction dun histogramme - Créer son blog

Un histogramme est un graphique composée de rectangles dont l'aire est proportionnelle à l'effectif de la classe Il y a deux cas possibles :



[PDF] Lhistogramme

Par défaut: 1) intervalles de même longueur; 2) règle de Sturges; 3) fréquences en ordonnée breaks: règle "Sturges" "Scott" ou "FD" Autres valeurs possibles: 



[PDF] Histogramme - HAL-SHS

23 juil 2009 · Cette connaissance peut alors servir pour construire des séquences didactiques mettant en jeu diverses notions méthodes et concepts



[PDF] TD n°1 de Statistiques : histogrammes CORRECTION

TD n°1 de Statistiques : histogrammes CORRECTION Préliminaire sur les densités : Monaco : 32 543 h Japon : 127 417 244 h (source INED 2005)



histogrammes; construction; exercices types - Warmaths

Que représente un histogramme ? Réponse : L'histogramme sert à représenter uniquement les séries à caractère quantitatif continu ( effectifs ou fréquences)



57 Histogramme - Statistique Canada

2 sept 2021 · Pour afficher la distribution d'une variable Type de variable Variables catégoriques Variables numériques Apparence La fréquence de chaque 



[PDF] Histogramme des fréquences cumul

construire le tableau des classes et des effectifs 2) Déterminer le pourcentage des prélèvements dont la résistance est strictement inférieure à 35 MPa



[PDF] chapitre 2 les graphiques - Eléments de statistiques

– Les histogrammes et les graphiques en barres ou en bâtons utilisent une échelle verticale sur laquelle on porte des effectifs ou des fréquences Sur quel 



[PDF] Exemple 1 : « Histogramme à pas constant » - Free

4 déc 2011 · 2/ Construire l'histogramme de cette série statistique 3/ Déterminer à 001 près la fréquence correspondant à chacune des classes

  • Comment construire l'histogramme de fréquence ?

    Les étapes de construction d'un histogramme
    Collectez les données avec la précision nécessaire. Déterminer le nombre de classes nécessaires ( voir encadré ci-dessous) Dénombrer le nombre d'occurence pour chacune des classes. Dessinez un histogramme basé sur la fréquence des données tombant à chaque intervalle.
  • Comment calculer la hauteur d'un histogramme ?

    Lire un histogramme
    La hauteur de chaque rectangle est égale à l'effectif de chaque classe.
  • Comment tracer la fréquence ?

    Relier les points par des segments de droites
    On suppose les valeurs régulièrement réparties au sein de chaque classe, on relie donc les points entre eux par des segments de droites. On obtient la courbe des fréquences cumulées croissantes. On relie les points pour obtenir la courbe des fréquences cumulées croissantes.
  • Un histogramme est constitué d'une succession de rectangles accolés . Lorsque les valeurs prises par un caractère statistique sont regroupées en classes , on les représente par un histogramme. L'aire de chaque « rectangle » est proportionnelle à l'effectif ou la fréquence associé (e).

Histogramme et courbe de densité de Kernel

Megbe Karamoko et Ibrahima Ousmane Ida

2015-04-13

Table des matières

1. Présentation de type de graphique

1

1.1. Histogramme

1

1.2. Courbe de densité de Kernel

1

1.3. Application aux données

2

1.4. Présentation des données

2

2. Histogramme et Courbe de densité avec des fonctions R de base

3

2.1 Histogramme avec des fonctions R de base

3

2.2 Courbe de densité avec des fonctions R de base

4

2.3 Surperposition de l"histogramme et la densité de kernel

4

3. Histogramme et courbe de densité avec le package ggplot2

4

3.1 Histogramme avec la fonction ggplot

6

3.2 Courbe de densité avec la fonction ggplot

7

4. Graphique avancé avec ggplot2

7

Références :

8 1. Présentation de type de graphique

1.1. HistogrammeEn analyse des données, il est opportun de faire des représentations graphiques des données. Cela nous donne

une idée de la forme des distributions, des statistiques de localisation (moyenne, écart-type, ...), des valeurs

aberrantes, etc. L"une des représentations courantes est l"histogramme. C"est un outil d"exploration qui

montre la distribution des données groupées en un ensemble de rectangles (ou intervalles). Chaque rectangle

de l"histogramme représente une classe de données et sa base correspond à la longueur de l"intervalle et la

surface du rectangle traduit la fréquence de la classe pour une représentation avec fréquence en ordonnée ou

la proportion pour une représentation avec la probabilité en ordonnée. Le nombre de classes a un impact

important sur le graphique de l"histogramme des données. Ce nombre peut se calculer selon des règles. Les

plus utilisées sont : règle de Sturges, règle de Scott et règle de Freedman-Diaconis. Les logiciels statistiques

utilisent par défaut la règle de Sturges.

1.2. Courbe de densité de Kernel

En statistique, l"estimation par noyau (ou encore courbe de densité de Kernel) est une méthode non

paramétrique d"estimation de la densité de probabilité d"une variable aléatoire. Elle est relative à l"histogramme;

elle permet de représenter un ensemble de données. En effet, la densité de Kernel offre une possibilité d"estimer

la distribution sur des données. En d"autres termes, elle estime la fréquence sur ces données.

La courbe de densité de Kernel constitue alors la représentation en forme de ligne lisse de cette distribution

estimée sur les données. La forme de la courbe dépend fortement du paramètre de lissage (appelé en anglais

bandwidth ou window width) ou encore le type du noyau. Parmi les types du noyau, nous pouvons citer entre

autres le noyau Epanechnikov, le noyau Gaussien, le noyau triangulaire, le noyau rectangulaire ou uniforme,

etc. La plupart des logiciels statistiques ont par défaut le noyau gaussien. C"est ce noyau que nous allons

utiliser par la suite pour l"estimation de la densité. 1

1.3. Application aux donnéesNotre démonstration va consister à produire d"abord un graphique simple en utilisant des fonctions graphiques

de base en R accompagné d"explications, ensuite un graphique simple avec des fonctions du package ggplot2

accompagné d"explications et finalement un graphique avancé en utilisant des fonctions du package ggplot2

accompagné d"explications.

1.4. Présentation des données

Nous allons utiliser les données du fichier hour.csv de Bike Sharing Dataset téléchargeable sur le UCI Machine

Learning Repository à l"adresse suivante :

h ttps://archive.ics.uci.edu/ml/datasets/Bike+Sharing+Dataset

Il s"agit de données concernant des nombres de locations de vélos par heure provenant d"un système de

location de vélos dans la ville de Washington D.C. aux États-Unis. Plus précisément, nous nous intéressons

aux données sur le nombre de locations effectuées entre 17h et 18h en 2011 et 2012.# Manipulation des données

# 1. Lecture du fichier de la table "hour.csv" des données

data_base <-read.csv("hour.csv",header = TRUE ,sep = "," )# 2. Extraction de la partie des données pour le travail,

# c?est à dire les données sur le nombre de locations entre 17h et 18h en 2011 et 2012. donnees <- data_base[ which(data_base$hr==17), ] # 3. Structure des données.Cela permet de voir le type des variables d?interêt str(donnees) ##?data.frame?: 730 obs. of 17 variables: ## $ instant : int 18 41 63 86 109 132 155 179 203 227 ... ## $ dteday : Factor w/ 731 levels "2011-01-01","2011-01-02",..: 1 2 3 4 5 6 7 8 9 10 ... ## $ season : int 1 1 1 1 1 1 1 1 1 1 ... ## $ yr : int 0 0 0 0 0 0 0 0 0 0 ... ## $ mnth : int 1 1 1 1 1 1 1 1 1 1 ... ## $ hr : int 17 17 17 17 17 17 17 17 17 17 ... ## $ holiday : int 0 0 0 0 0 0 0 0 0 0 ... ## $ weekday : int 6 0 1 2 3 4 5 6 0 1 ... ## $ workingday: int 0 0 1 1 1 1 1 0 0 1 ... ## $ weathersit: int 2 1 1 1 1 1 2 1 1 1 ... ## $ temp : num 0.44 0.34 0.24 0.28 0.24 0.22 0.2 0.16 0.18 0.2 ... ## $ atemp : num 0.439 0.333 0.227 0.273 0.227 ... ## $ hum : num 0.82 0.57 0.3 0.48 0.38 0.51 0.37 0.37 0.37 0.4 ... ## $ windspeed : num 0.284 0.194 0.224 0.224 0.194 ... ## $ casual : int 15 7 11 10 4 9 9 5 3 4 ... ## $ registered: int 52 58 146 202 186 163 178 64 59 174 ... ## $ cnt : int 67 65 157 212 190 172 187 69 62 178 ...

Nos variables d"interêt sontcnt,yr,hretweathersit. La variableyrconcerne les années. Elle est de type

entier et prend la valeur 0 pour 2011 et 1 pour 2012. Nous allons la rendre en facteur avec les niveaux2011

et2012.donnees$yr <-as.factor(donnees$yr) levels(donnees$yr) <-c("2011","2012" )

La variableweathersitcontient les climats. Nous allons la renommerTemperature; elle est de type entier

et prend les valeurs; 1 : clair, partiellement nuageux, 2 : brume + nuageux, brume + Peu de nuages, 3 : neige

légère, Pluie + orage + Peu de nuages, pluie + Éclaircies. Nous allons la rendre en facteur avec les niveaux respectifsDégagé,Nuage, brume,Pluie, neige. 2 colnames(donnees)[which(colnames(donnees)=="weathersit")] <-"Temperature" donnees$Temperature <-as.factor(donnees$Temperature) levels(donnees$Temperature) <-c("Dégagé","Nuage, brume" ,"Pluie, neige" )

À ce stade, nos données sont prêtes pour être exploitées adéquatement selon nos besoins.str(donnees)

##?data.frame?: 730 obs. of 17 variables: ## $ instant : int 18 41 63 86 109 132 155 179 203 227 ... ## $ dteday : Factor w/ 731 levels "2011-01-01","2011-01-02",..: 1 2 3 4 5 6 7 8 9 10 ... ## $ season : int 1 1 1 1 1 1 1 1 1 1 ... ## $ yr : Factor w/ 2 levels "2011","2012": 1 1 1 1 1 1 1 1 1 1 ... ## $ mnth : int 1 1 1 1 1 1 1 1 1 1 ... ## $ hr : int 17 17 17 17 17 17 17 17 17 17 ... ## $ holiday : int 0 0 0 0 0 0 0 0 0 0 ... ## $ weekday : int 6 0 1 2 3 4 5 6 0 1 ... ## $ workingday : int 0 0 1 1 1 1 1 0 0 1 ... ## $ Temperature: Factor w/ 3 levels "Dégagé","Nuage, brume",..: 2 1 1 1 1 1 2 1 1 1 ... ## $ temp : num 0.44 0.34 0.24 0.28 0.24 0.22 0.2 0.16 0.18 0.2 ... ## $ atemp : num 0.439 0.333 0.227 0.273 0.227 ... ## $ hum : num 0.82 0.57 0.3 0.48 0.38 0.51 0.37 0.37 0.37 0.4 ... ## $ windspeed : num 0.284 0.194 0.224 0.224 0.194 ... ## $ casual : int 15 7 11 10 4 9 9 5 3 4 ... ## $ registered : int 52 58 146 202 186 163 178 64 59 174 ... ## $ cnt : int 67 65 157 212 190 172 187 69 62 178 ...

2. Histogramme et Courbe de densité avec des fonctions R de base

2.1 Histogramme avec des fonctions R de baseLa principale fonction de base permettant de construire l"histogramme d"un vecteur d"observations en R est la

fonctionhist. Elle comporte plusieurs arguments permettant d"ajouter des détails à l"histogramme ou spécifier

le type de fréquences (simples ou relatives) qui seront utilisées. Parmi ceux-ci, il y a notamment les arguments :

breakspour le nombre de classes,freqpour une représentation de fréquence en ordonnée,probabilitypour

une représentation de probabilité en ordonnée,mainpour le titre,xlabpour le nom de l"axe des abscisses,

ylabpour le nom de l"axe des ordonnées, etc.

La commande ci-dessous permet de représenter l"histogramme de la distribution du nombre de locations

effectuées entre 17 h et 18 h en 2011 pour le climat dégagé.hist(donnees[donnees$yr=="2011"&donnees$Temperature=="Dégagé","cnt" ])

Nous allons ajouter progressivement les argumentsfreq,main,xlab,ylabà l"histogramme.

On peut choisir de construire l"histogramme avec des fréquences relatives au lieu des fréquences simples grâce

à l"argumentfreq.hist(donnees[donnees$yr=="2011"&donnees$Temperature=="Dégagé","cnt" ], breaks = 13 freq = FALSE

Pour donner un titre à l"histogramme et nommer les axes, nous allons utiliser les argumentsmain,xlabet

ylab. 3 hist(donnees[donnees$yr=="2011"&donnees$Temperature=="Dégagé","cnt" ], breaks = 13 freq = FALSE main = "Densité empirique du nombre de locations entre 17h et 18h en 2011 par temps dégagé" xlab = "nombre de locations entre 17h et 18h" ylab = "densité"

2.2 Courbe de densité avec des fonctions R de baseLa fonctiondensityde R de base permet de calculer la densité de Kernel pour estimer la distribution sur

des données.

Pour illustrer cela, nous allons calculer la densité du nombre de locations en 2011 par climat dégagé par la

commande suivante :densite <-density(donnees[donnees$yr=="2011"&donnees$Temperature=="Dégagé","cnt" ])

plot(densite)

2.3 Surperposition de l"histogramme et la densité de kernel

Représentons sur le même graphique l"histogramme et la courbe de densité à l"aide de la fonctionlines.hist(donnees[donnees$yr=="2011"&donnees$Temperature=="Dégagé","cnt" ],

breaks = 13 freq = FALSE main = "Densité empirique du nombre de locations entre 17h et 18h en 2011 par temps dégagé" xlab = "nombre de locations entre 17h et 18h" ylab = "densité" densite <-density(donnees[donnees$yr=="2011"&donnees$Temperature=="Dégagé","cnt" ]) lines(densite) Densité empirique du nombre de locations entre 17h et 18h en 2011 par temps dégagé nombre de locations entre 17h et 18h densité

0100200300400500600

0.0000

0.0010

0.0020

0.00303. Histogramme et courbe de densité avec le package ggplot2

L"histogramme et la courbe de densité représentés précédemment peuvent facilement être reproduits en

utilisant des fonctions du package ggplot2. Cette reproduction peut être scindée en deux étapes : une première

étape pour dessiner l"histogramme et la seconde pour représenter la courbe de densité. Dans ggplot2, nous

retenons deux méthodes pour représenter les graphiques notamment avec les fonctionsqplotetggplot. Ces

fonctions définissent les parcelles dédiées à la représentation graphique. La méthode avec qplot offre une

rapidité de programmation et une utilisation interactive. Cependant, la fonction ggplot est plus complète

4

en syntaxe. Elle est plus facile à utiliser pour les personnes déjà familières avec les fonctions graphiques R

de base. Pour illustrer, les commandes suivantes permettent de produire deux histogrammes, l"un avec la

fonctionqplotet l"autre avec la fonctionggplot:# Il faut tout d?abord charger le package ggplot2 library(ggplot2) qplot(cnt,data = donnees, geom = "histogram" ) 0 20 40

02505007501000

cntggplot(donnees,aes(x =cnt)) +geom_histogram () 5 0 20 40

02505007501000

cnt count

Les deux histogrammes précédents sont produits avec les paramètres par défaut de ggplot2. Ils permettent

simplement de montrer le résultat que donnent les fonctionsqplotetggplot. Mais, dans la suite du travail,

toutes représentations graphiques seront faites avec la fonctionggplot.

3.1 Histogramme avec la fonction ggplot

La fonctionggplotdu package ggplot2 permet de produire une zone graphique à laquelle on peut ajouter des

couches graphiques. La fonction qui sert à ajouter une couche d"histogramme est la fonctiongeom_histogram.

Cette dernière comprend des arguments tels questat,fill,position,linetype,size,colour, etc. qui

permettent de définir les caractéristiques de l"histogramme et de lui ajouter des détails pour l"améliorer.

Créons la zone graphique avec la fonctionggplotet ses deux argumentsdataetaespermettent de préciser

les données qui seront utilisées et la variable à représenter.# Création de la zone graphique.

zone <-ggplot(donnees[donnees$yr=="2011"&donnees$Temperature=="Dégagé", ],aes(x =cnt)) Nous allons ajouter la couche de l"histogramme avec la fonctiongeom_histogram. L"argumentcolourdonne

la possibilité de choisir la couleur des lignes des rectangles de l"histogramme,fillla couleur de remplissage

etbinwidthla largeur des rectangles. L"argumentaesspécifie le type de fréquences utilisées.quotesdbs_dbs44.pdfusesText_44
[PDF] histogramme des effectifs

[PDF] histogramme de fréquence excel

[PDF] polygone de fréquence cumulée

[PDF] comment faire un histogramme sur excel 2010

[PDF] exemple discussion français

[PDF] représentation graphique variable quantitative

[PDF] principe d'autonomie en ethique

[PDF] autonomie du patient hospitalisé

[PDF] histogramme sous r

[PDF] principe d'autonomie du patient

[PDF] graphique r studio

[PDF] principe de bienfaisance éthique

[PDF] graphique sous r

[PDF] principe d'autonomie définition

[PDF] courbe r