[PDF] Lire ; Compter ; Tester avec R





Previous PDF Next PDF



Histogrammes

SEMIN-R du MNHN



GERAD - Les graphiques dans R par Odile Wolber

Sous Mac pour créer une nouvelle fenêtre graphique



TP 3 : Graphiques avec R Table des matières

utilisés sous forme d'options graphiques pour certains ou bien à l'aide de En R la commande hist(x) permet de tracer l'histogramme des données x avec ...



Introduction aux graphiques avec R - CEL

30 oct. 2016 Pour avoir un aperçu des possibilités graphiques du logiciel R on fait : ... Notons que l'histogramme obtenu a même allure que le précédent ...



Démarrer en R

12 juin 2012 Les fonctions forment l'unité de base de la programmation sous R. Elles ... Pour l'histogramme des probabilités sur chaque intervalle Ij ...



Décomposition dun histogramme en composantes gaussiennes

En d'autres termes on suppose qu'on a une population formée de r sous populations



Lire ; Compter ; Tester avec R

3.4.2 Histogramme . Graphique Histogramme des effectifs ... Sous R. Nominale factor. Ordonnée ordered. Discr`ete numeric (ou integer). Continue.



Graphiques de base

On peut (aussi) faire de mauvais graphiques sous R Le probl`eme des histogrammes est que le choix du découpage en intervalles est assez arbitraire.



TP2 : Analyse de données quantitatives avec le logiciel R

pouvez résumer ces données sous la forme d'un tableau de fréquences. Le problème de l'histogramme est la définition des classes.



Lhistogramme

Aire sous l"histogramme = ?j nj nh × h = 1. J.-C. Mass´e L'histogramme dans R. La fonction hist ... Premier histogramme: multimodal (sous-lissage);.



[PDF] GERAD - Les graphiques dans R par Odile Wolber

Par défaut la couleur standard du fond du graphique axes si 'TRUE' (valeur par défaut) les axes sont dessinés si l'histogramme est



[PDF] Histogrammes

REPRESENTATIONS GRAPHIQUES SOUS R HISTOGRAMMES Séverine ZIRAH Molécules de communication et adaptation des micro-organismes FRE 3206 CNRS / USM 502 MNHN



[PDF] Graphiques de base

Logiciel R version 4 2 0 (2022-04-22) – Compilé le 2022-09-20 Graphiques de base Le problème des histogrammes est que le choix du découpage en



[PDF] TP 3 : Graphiques avec R Table des matières - Aude Illig

En R la commande hist(x) permet de tracer l'histogramme des données x avec les options classiques main xlim xlab ylab et les options spécifiques : – 



[PDF] Fonctions graphiques de R

Un rapide aperçu des très riches fonctions graphiques de R pour gérer fenêtres et fichiers tracer des camemberts diagrammes en colonnes mosaïc plot 



[PDF] Notes de Cours sur le logiciel R

22 jan 2018 · Sous MacOS et Windows un éditeur de texte intégré au logiciel R défaut l'histogramme est dessiné avec 30 classes x=rnorm (100)



[PDF] Les graphiques dans R (1/2): créer - Capsules R Université Laval

Le tableau suivant présente les quatre types de graphiques fréquemment utilisés en biologie Fonction Description hist(x) Histogramme de la variable continue 



[PDF] Lhistogramme

Aire sous l"histogramme = ?j nj nh × h = 1 J -C Mass´e L'histogramme dans R La fonction hist Premier histogramme: multimodal (sous-lissage);



ggplot2 histogramme : Guide de démarrage rapide - Logiciel R et

Ce tutoriel R décrit comment créer un histogramme de distribution avec le logiciel R et le package ggplot2 La fonction geom_histogram() est utilisée

  • Comment faire un histogramme sur r ?

    Cliquez sur Rectangles et Barres (à gauche de l'histogramme), puis sur Intervalles et Etiquettes. En somme dans R++, modifier un histogramme se fait sans code, comme dans MS Excel. Mais en un clic, vous pouvez visualiser tous les histogrammes de toutes les variables numériques.
  • Comment tracer une courbe avec R ?

    8.1 La fonction plot() La fonction la plus couramment utilisée pour produire des graphiques dans R est la fonction plot() . plot() est une fonction générique dont le comportement s'adapte automatiquement à la nature de ses arguments.
  • Comment faire un histogramme avec des classes ?

    Chaque classe est alors représentée par un rectangle dont la base est proportionnelle à son amplitude et de hauteur telle que l'aire du rectangle soit proportionnelle à son effectif. Dans le cas de classes de même amplitude, il suffit que la hauteur des rectangles soit proportionnelle à l'effectif.
  • L'histogramme est un outil fréquemment utilisé pour résumer des données discrètes ou continues qui sont présentées par intervalles de valeurs. Il est souvent employé pour montrer les caractéristiques principales de la distribution des données de façon pratique.

Lire ; Compter ; Tester... avec R

Preparation des donnees / Analyse univariee / Analyse bivariee

Christophe Genolini

2

Table des matieres

1 Rappels theoriques 5

1.1 Vocabulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5

1.2 Nature d'une variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5

1.3 Principe de l'analyse univariee . . . . . . . . . . . . . . . . . . . . . . . . .

6

1.4 Principe de l'analyse bivariee . . . . . . . . . . . . . . . . . . . . . . . . . .

6

2 Preparation des donnees 9

2.1 Telecharger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

2.2 Lecture des donnees . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

2.3 Manipulation d'un data.frame . . . . . . . . . . . . . . . . . . . . . . . . . .

11

2.4 Modication d'une valeur . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

2.5 Type de variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

3 Analyse univariee 15

3.1 Eectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15

3.2 Centralite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

3.2.1 Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

3.2.2 Mediane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

3.2.3 Moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

3.3 Dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

3.3.1 Quartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

3.3.2Ecart type et variance . . . . . . . . . . . . . . . . . . . . . . . . . .19

3.4 Representation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

3.4.1 Diagramme en baton . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

3.4.2 Histogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20

3.4.3 Bo^te a moustaches . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

3.4.4 Export d'un graphique . . . . . . . . . . . . . . . . . . . . . . . . . .

22

4 Analyse bivariee 23

4.1 Eectifs, centralite et dispersion . . . . . . . . . . . . . . . . . . . . . . . .

23

4.2 Representation graphique bivariee . . . . . . . . . . . . . . . . . . . . . . .

24

4.2.1 Deux qualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24

4.2.2 Qualitative & numerique . . . . . . . . . . . . . . . . . . . . . . . .

24

4.2.3 Deux numeriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

4.3 Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

4.3.1 Qualitative & Qualitative . . . . . . . . . . . . . . . . . . . . . . . .

25

4.3.2 Qualitative (2 classes) & Numerique . . . . . . . . . . . . . . . . . .

27

4.3.3 Qualitative (3 classes et plus) & Numerique . . . . . . . . . . . . . .

29

4.3.4 Numerique & Numerique . . . . . . . . . . . . . . . . . . . . . . . .

30
3

4TABLE DES MATIERES

Chapitre 1

Rappels theoriques

1.1 VocabulaireNomDenitionExemple

IndividuObjet etudieun etudiant

PopulationEnsemble des individustous les etudiants participant a l'ex- perienceVariablesCe qui est etudie chez les individus (et qui varie d'un individu a l'autre)[Age],[CigaretteJour],[Ni- veauSportif]Modalites (d'une variable)Liste de toutes les valeurs possibles pour une variableModalites de[Age]: de 0 ans a 120 ansObservationValeurs prises par un individu par- ticulierMarc a 21 ans,(21)est une obser- vation.1.2 Nature d'une variable La nature d'une variable determine le type d'outil statistique qu'on pourra utiliser sur la variable. Pour determiner son type, il faut se demander ce qu'on peut faire avec ses observations : 5

6CHAPITRE 1. RAPPELS THEORIQUES1.3 Principe de l'analyse univariee

L'analyse univariee permet de mieux apprehender une variable. Elle comporte quatre etapes : 1.

Cal culde se ectifs

2.

Cal culde la c entralite

3.

Cal culde la d ispersion

4.

Rep resentationgrap hique

Ces etapes varient selon le type de variable. Voila le detail des etapes en fonction du type de variable :

EtapeNominaleOrdonneeDiscreteContinue

1. EectifsA faireA faireA faireInutile

2. CentraliteModeMedianeMoyenne et

MedianeMoyenne et

Mediane3. DispersionN'existe pasQuartile

Ecart type et

quartiles

Ecart type et

quartile4. GraphiqueHistogramme des eectifsHistogramme des eectifsHistogramme des eec- tifs, bo^te a moustacheDistribution et bo^te a mous- tache1.4 Principe de l'analyse bivariee L'analyse bivariee consiste a etudier deux variables conjointement, puis eventuellement a tester le lien entre les deux variables.

1.4. PRINCIPE DE L'ANALYSE BIVARI

EE7 Deux variables sont liees si conna^tre l'une donne des informations sur l'autre. Par exemple, conna^tre le sexe d'un individu permet d'en savoir un peu plus sur la longueur de ses cheveux. Attention, cela ne permet pas deconna^tremais juste d'avoir une information plus precise. Par exemple, dans l'UFR STAPS, 20% des individus ont les cheveux longs. Si on detaille selon les sexes, 4% des garcons ont les cheveux long contre 55% des lles. Conna^tre le sexe d'un individu ne donne donc aucune certitude, mais permet d'avoir un peu plus d'informations. Pour savoir si deux variables sont liees (avec un certain risque d'erreur, imcompres-

sible), on utilise un test. Le test a utiliser depend du type des variables et de leur proprietes :VariablesTest parame-

triqueDiagnosticTest non para- metriqueQualitative

Qualitative

21.Les v aleursd et outesl escase s

du tableau des eectifs atten- dus doivent ^etre superieures ou egales a 5.Test exact de Fi- sherQualitative (2 classes)& NumeriqueT de Student1.Les ecartt ypess ont egaux 2.

P ourc haquegr oupe,l av a-

riable numerique suit une loi normale OU les eectifs sont superieurs a 30.Test des rangs de

WilcoxonQualitative

(3 classes et plus)&

NumeriqueF de Fisher

(ANOVA)1.Les ecartt ypess ont egaux 2.

P ourc haquegr oupe,l av a-

riable numerique suit une loi normale OU les eectifs sont superieurs a 30.Test de Kruskal-

WallisNumerique

NumeriqueR de Pearson1.Au moi nsu ned esde uxv a-

riables suit une loi normale.R de Spearman

8CHAPITRE 1. RAPPELS THEORIQUES

Chapitre 2

Preparation des donnees

2.1 Telecharger

Avant de lire les donnees, ils vous faut R... Vous pouvez le telecharger sur le site du

CRAN :http:

cran.r-paoject.orgpuisDownload and Install R. Cliquez ensuite sur votre systeme d'exploitation (Linux, MacOS X ou Windows) puis telepcharger R en cliquant surbase.

2.2 Lecture des donnees

Excel etant un logiciel proprietaire, il est dicile a un autre logiciel de lire le format .xls. Par contre, R sait lire les chiers au format.csv. Donc, nous allons preparer un chier.csv. 1. O uvrezv osdon neessou sE xcel,O penO ce,S PSS,SAS ... 2. D ansl em enuFichierouFile, il existe probablement une optionEnregistrer sousou Exporter. Choisissez le format.csv. Si votre logiciel demande des precisions, vous pouvez lui specier :separateur decimal="."etseparateur=";". S'il ne demande rien, tout va bien. Un chier.csvvient d'^etre cree dans votre repertoire. Pour le lire a partir de R, il faut lui preciser le repertoire de lecture. Cela se fait a partir de la fen^etre R, dans le menu

Fichier!Changer le repertoire courant.

Il est maintenant possible de lire vos donnees a partir de R gr^ace a l'instruction :>### Lecture des donnees>r ead.csv2("FormationR.csv")

id sexe age taille niveau departement UFR frereEtSoeur

1 1 F 22 1,7 L3 75 SJAP 0

2 2 F 20 1,66 L3 92 SEGMI 0

3 3 F L3 78 SEGMI 0

4 4 F 25 1,65 M2 75 SJAP 0

5 5 F 340 1,62 M2 92 STAPS 0

6 ... ... ... ... ... ... ... ...

rapportRisque transAvecPres rapportAge rapportSexuel scoreConnaissance

1 Non 19 Oui 3

2 Non Non 18 Oui

3 Oui Non 15 Oui 2

4 Non 17 Oui 1

5 Oui Non 21 Oui 3

6 ... ... ... ... ...

9

10CHAPITRE 2. PREPARATION DES DONNEES

Pour pouvoir manipuler ce chier (et faire des statistiques dessus), il faut le stocker dans une variable de type un peu special qu'on appelledata.frame. Cela se fait a l'aide de la

eche d'aectation<-. Pour stocker vos donnees dans la variabledata, tapez :>### Lecture des donnees avec stocakge>d ata< -r ead.csv2("FormationR.csv")

Il ne se passe rien a l'ecran, maisdatacontient maintenant vos donnees. Pour veriez que c'est bien le cas, tapez simplementdata. R ache alors le contenu dedata, c'est a dire vos donnees.>### Verification que les donnees sont en memoire>d ata id sexe age taille niveau departement UFR frereEtSoeur

1 1 F 22 1,7 L3 75 SJAP 0

2 2 F 20 1,66 L3 92 SEGMI 0

3 3 F L3 78 SEGMI 0

4 4 F 25 1,65 M2 75 SJAP 0

5 5 F 340 1,62 M2 92 STAPS 0

6 ... ... ... ... ... ... ... ...

rapportRisque transAvecPres rapportAge rapportSexuel scoreConnaissance

1 Non 19 Oui 3

2 Non Non 18 Oui

3 Oui Non 15 Oui 2

4 Non 17 Oui 1

5 Oui Non 21 Oui 3

6 ... ... ... ... ...

Le pire ennemi du statisticien, tous les enqu^eteurs le savent, est lavaleur manquante. En R, les valeurs manquantes sont codeesNAou. Dans votre chier.csv, le codage de la valeur manquante depend de votre logiciel : case vide pour Excel et Open oce, un point pour SAS,... Il faut donc preciser a R le type de valeur manquante qu'il va rencontrer dans le chier. Cela se fait en ajoutant l'optionna.string="codage_Manquante"dans la ligne de lecture. Ainsi, si votre.csva ete obtenu a partir d'Excel ou Open oce, l'instruction

de lecteure estread.csv2("nom_de_fichier.csv", na.string = "")>### Lecture des donnees en considerant les manquantes>d ata< -r ead.csv2("FormationR.csv",na.string="")

d ata id sexe age taille niveau departement UFR frereEtSoeur

1 1 F 22 1,7 L3 75 SJAP 0

2 2 F 20 1,66 L3 92 SEGMI 0

3 3 F L3 78 SEGMI 0

4 4 F 25 1,65 M2 75 SJAP 0

5 5 F 340 1,62 M2 92 STAPS 0

6 ... ... ... ... ... ... ... ...

rapportRisque transAvecPres rapportAge rapportSexuel scoreConnaissance

1 Non 19 Oui 3

2 Non Non 18 Oui

3 Oui Non 15 Oui 2

4 Non 17 Oui 1

5 Oui Non 21 Oui 3

6 ... ... ... ... ...

On constate que les cases vides ont ete remplacees par desNAou des. Si vous aviez utilise SAS, l'instuction auraitetedata <- read.csv2("nom_de_fichier.csv",na.string=".").

2.3. MANIPULATION D'UN DATA.FRAME11

2.3 Manipulation d'un data.frame

dataest un data.frame, c'est-a-dire un tableau contenant vos donnees. Chaque colonne du tableau contient une variable. Chaque ligne du tableau est un individu. Pour travailler sur une colonne precise (par exemple la deuxieme), tapezdata[,2]. Vous pouvez egale-

ment taper le nom du data.frame, puis le symbole $ suivi du nom de la colonne :>### Deuxieme colonne>d ata[,2]

[1] F F F F F F F F F F F F F [15] F F F F F F F F F F H H H [29] H H H H H H H H H H H H

Levels: F H

>### Colonne sexe>d ata$sexe [1] F F F F F F F F F F F F F [15] F F F F F F F F F F H H H [29] H H H H H H H H H H H H

Levels: F H

R ache le contenu de la colonne. Il indique egalement les modalites de la variable (Levels). Pour acceder a une ligne (par exemple la troisieme), tapezdata[3,]>### Troisieme ligne>d ata[3,] id sexe age taille niveau departement UFR frereEtSoeur rapportRisque

3 3 NA NA L3 78 SEGMI 0 Oui

transAvecPres rapportAge rapportSexuel scoreConnaissance

3 Non 15 Oui 2

Pour acceder a une colonne et une ligne, on combine les deux :data[3,2]nous donne la valeur du troisieme individu, deuxieme colonne;data$sexe[3]donne la troisieme valeur de la colonnesexe.>### Affichage d"une valeur precise>d ata[3,2] [1]

Levels: F H

d ata sexe[3] [1]

Levels: F H

2.4 Modication d'une valeur

La modication d'une valeur se fait gr^ace a l'operateur<-. L'instructiona <- 5a pour eet de creer la variableaet de placer la valeur 5 dans cette variable. Dans le cas d'un data.frame, on peut souhaiter modier une valeur particuliere. Par exemple, l'individu 5 a pour age340, ce qui semble plut^ot improbable. Apres verication, il s'agit simplement d'une erreur de saisie, la vraie valeur est 34. Il faut donc remplacer340par34. Cela se fait avec<-.

12CHAPITRE 2. PREPARATION DES DONNEES>### Variable age>d ata$age

[1] 22 20 NA 25 340 20 19 18 21 21 21 19 18 21 24 21 21 [18] 21 20 NA 19 NA 21 21 21 24 19 23 20 22 23 23 21 23 [35] 21 22 22 22 19 22 >### Cinquieme valeur de age>d ata$age[5] [1] 340 >### Modification de la cinquieme valeur>d ata$age[5]< -3 4 >### Verification>d ata$age [1] 22 20 NA 25 34 20 19 18 21 21 21 19 18 21 24 21 21 21 20 NA 19 NA 21 [24] 21 21 24 19 23 20 22 23 23 21 23 21 22 22 22 19 22 La cinquieme valeur de la colonneagea ete corrigee.

2.5 Type de variable

Chaque colonne correspond a une variable et a donc une type. Les dierents type de

variables statistique decrites section 1.2 page 5 correspondent aux types R suivant :En statistique Sous R

Nominalefactor

Ordonneeordered

Discretenumeric(ouinteger)

Continuenumeric(ouinteger)Quand R charge un cher en memoire (dansdata), il donne a chaque variable un type.

quotesdbs_dbs44.pdfusesText_44
[PDF] principe d'autonomie du patient

[PDF] graphique r studio

[PDF] principe de bienfaisance éthique

[PDF] graphique sous r

[PDF] principe d'autonomie définition

[PDF] courbe r

[PDF] autonomie décisionnelle définition

[PDF] diagramme en baton r

[PDF] barplot sur r

[PDF] autonomie du patient définition

[PDF] barplot sous r

[PDF] autonomie du patient loi

[PDF] histogram r studio

[PDF] la littérature est elle une bonne arme contre les inégalités

[PDF] longtemps j'ai pris ma plume pour une épée citation