[PDF] Lire ; Compter ; Tester avec R





Previous PDF Next PDF



Créer une boite à moustache avec Excel 2010

Création des boites à moustaches : Sélectionner le tableau que nous venons de créer. Dans l'onglet insertion dans la zone graphiques



Boites à moustaches – OOo calc - Free

Ce tutoriel permet de réaliser des boites à moustaches avec OOo calc (suite Open Office 3.1.) Première ligne comme étiquette.



Excel Ce tutoriel permet de réaliser des boites à moustaches avec

valeurs extrêmes sur les caractéristiques d'une boite à moustache (minimum 1 Lignes haut/bas et. Barres haut/bas. 2) Largeur de l'intervalle 350 ...



La boîte à moustaches de TUKEY un outil pour initier à la Statistique

12 juin 2008 La boîte à moustaches une traduction de Box & Whiskers Plot est une invention de TUKEY ... SEL Statistique en ligne de l'INRIA.



Exercices sur les diagrammes en boîtes à moustaches Première Pro

On donne 3 diagrammes en boîte à moustache correspondant aux résultats de 3 classes de première Bac Pro à un même devoir de mathématiques (la moyenne est 



Lire ; Compter ; Tester avec R

3.4.3 Bo?te `a moustaches . Chaque ligne du tableau est un individu. ... Pour accéder `a une colonne et une ligne on combine les deux : data[3



STI2D - 1S1 - S On appelle communément « boite à moustache » un

On appelle communément « boite à moustache » un diagramme qui résume les caractéristiques de position. (médiane quartiles



Intro à la visualisation de données en R

Les 'moustaches' ou les lignes qui sortent de chaque boîte



Statistiques à une variable Représentations graphiques dune série

Descendre sur la ligne Xlist : Saisir L1 Affichage du diagramme en boîte. Les boîtes à moustache sont tracées en fonction de Xmin et Xmax mais ne ...



La boîte à moustaches pour sensibiliser à la statistique

12 juin 2008 La boîte à moustaches une traduction de Box & Whiskers Plot est une invention de TUKEY ... SEL Statistique en ligne de l'INRIA.

  • Créer Un Graphique en Boîte

    Pour créer un graphique en boîte en ligne, il suffit de sélectionner les variables à partir desquelles vous souhaitez créer celui-ci! En fonction du niveau d'échelle des variables sélectionnées, un bon graphique en boîte sera créé pour vous! Par exemple, si vous sélectionnez une variable métrique et une variable nominale à trois niveaux, un graphiq...

  • Explication Du Boxplot

    Qu'est-ce qu'un boîte à moustache? Les boxplots sont utilisés en statistiques pour afficher clairement la médiane, la moyenne et la dispersion des données dans un diagramme. Les données doivent être au moins échelonnées par intervalles. Un boîte à moustaches est souvent utilisé pour comparer et opposer deux groupes ou plus. Les boxplots sont égalem...

  • Interpréter Le Graphique en Boîte

    Un graphique en boîte contient beaucoup d'information, c'est pourquoi son interprétation peut être très variée. Il se compose de trois parties, la boîte, deux moustaches en forme de T, également appelée palpeurs, et deux lignes. 1. la boîte 2. deux lignes 3. les moustaches en forme de T La boîte elle-même indique l'intervalle dans lequel se situe l...

  • Graphique en Boîte : Moustaches

    La définition des moustaches n'est pas toujours uniforme. La plupart du temps la définition supérieure est utilisée, c'est-à-dire que les moustaches vont jusqu'au dernier point qui se situe entre 1,5 fois la distance interquartile. Les graphiques en boîtes créés en ligne sur DATAtab adhèrent également à cette définition. Dans d’autres cas, les mous...

Comment présenter une boîte à moustache ?

La boîte à moustache peut être présentée horizontalement, comme à la figure 4.5.2.1, ou verticalement. Une variante de la boîte à moustaches restreint la longueur des moustaches à un maximum d’une fois et demi la valeur de l’écart interquartile.

Comment calculer là moyenne d’une boîte à moustaches ?

Les côtés gauche et droit de la boîte sont les quartiles inférieur et supérieur. La boîte couvre donc l’intervalle interquartile, là où se situent 50 % des données. La ligne verticale qui sépare la boîte en deux représente la médiane. Parfois, la moyenne est également indiquée par un point ou une croix sur la boîte à moustaches.

Comment changer le mode de visualisation d'une boîte à moustaches ?

Si la boîte à moustaches inclut un champ Group by (Regrouper par), le mode de visualisation peut être modifié sur diagrammes, par exemple un line graph (diagramme linéaire) ou column chart (diagramme en colonnes). Cliquez sur le bouton Flip card (Retourner la fiche) pour visualiser le verso de la fiche.

Qu'est-ce que les moustaches ?

Les moustaches sont les deux lignes horizontales à l’extérieur de la boîte qui s’étendent du minimum jusqu’au quartile inférieur (le début de la boîte) et du quartile supérieur (la fin de la boîte) jusqu’au maximum. Le diagramme est habituellement accompagné d’un axe qui indique les valeurs (non montré à la figure 4.5.2.1).

Lire ; Compter ; Tester avec R

Lire ; Compter ; Tester... avec R

Preparation des donnees / Analyse univariee / Analyse bivariee

Christophe Genolini

2

Table des matieres

1 Rappels theoriques 5

1.1 Vocabulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5

1.2 Nature d'une variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5

1.3 Principe de l'analyse univariee . . . . . . . . . . . . . . . . . . . . . . . . .

6

1.4 Principe de l'analyse bivariee . . . . . . . . . . . . . . . . . . . . . . . . . .

6

2 Preparation des donnees 9

2.1 Telecharger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

2.2 Lecture des donnees . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

2.3 Manipulation d'un data.frame . . . . . . . . . . . . . . . . . . . . . . . . . .

11

2.4 Modication d'une valeur . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

2.5 Type de variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

3 Analyse univariee 15

3.1 Eectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15

3.2 Centralite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

3.2.1 Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

3.2.2 Mediane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

3.2.3 Moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

3.3 Dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

3.3.1 Quartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

3.3.2Ecart type et variance . . . . . . . . . . . . . . . . . . . . . . . . . .19

3.4 Representation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

3.4.1 Diagramme en baton . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

3.4.2 Histogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20

3.4.3 Bo^te a moustaches . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

3.4.4 Export d'un graphique . . . . . . . . . . . . . . . . . . . . . . . . . .

22

4 Analyse bivariee 23

4.1 Eectifs, centralite et dispersion . . . . . . . . . . . . . . . . . . . . . . . .

23

4.2 Representation graphique bivariee . . . . . . . . . . . . . . . . . . . . . . .

24

4.2.1 Deux qualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24

4.2.2 Qualitative & numerique . . . . . . . . . . . . . . . . . . . . . . . .

24

4.2.3 Deux numeriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

4.3 Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

4.3.1 Qualitative & Qualitative . . . . . . . . . . . . . . . . . . . . . . . .

25

4.3.2 Qualitative (2 classes) & Numerique . . . . . . . . . . . . . . . . . .

27

4.3.3 Qualitative (3 classes et plus) & Numerique . . . . . . . . . . . . . .

29

4.3.4 Numerique & Numerique . . . . . . . . . . . . . . . . . . . . . . . .

30
3

4TABLE DES MATIERES

Chapitre 1

Rappels theoriques

1.1 VocabulaireNomDenitionExemple

IndividuObjet etudieun etudiant

PopulationEnsemble des individustous les etudiants participant a l'ex- perienceVariablesCe qui est etudie chez les individus (et qui varie d'un individu a l'autre)[Age],[CigaretteJour],[Ni- veauSportif]Modalites (d'une variable)Liste de toutes les valeurs possibles pour une variableModalites de[Age]: de 0 ans a 120 ansObservationValeurs prises par un individu par- ticulierMarc a 21 ans,(21)est une obser- vation.1.2 Nature d'une variable La nature d'une variable determine le type d'outil statistique qu'on pourra utiliser sur la variable. Pour determiner son type, il faut se demander ce qu'on peut faire avec ses observations : 5

6CHAPITRE 1. RAPPELS THEORIQUES1.3 Principe de l'analyse univariee

L'analyse univariee permet de mieux apprehender une variable. Elle comporte quatre etapes : 1.

Cal culde se ectifs

2.

Cal culde la c entralite

3.

Cal culde la d ispersion

4.

Rep resentationgrap hique

Ces etapes varient selon le type de variable. Voila le detail des etapes en fonction du type de variable :

EtapeNominaleOrdonneeDiscreteContinue

1. EectifsA faireA faireA faireInutile

2. CentraliteModeMedianeMoyenne et

MedianeMoyenne et

Mediane3. DispersionN'existe pasQuartile

Ecart type et

quartiles

Ecart type et

quartile4. GraphiqueHistogramme des eectifsHistogramme des eectifsHistogramme des eec- tifs, bo^te a moustacheDistribution et bo^te a mous- tache1.4 Principe de l'analyse bivariee L'analyse bivariee consiste a etudier deux variables conjointement, puis eventuellement a tester le lien entre les deux variables.

1.4. PRINCIPE DE L'ANALYSE BIVARI

EE7 Deux variables sont liees si conna^tre l'une donne des informations sur l'autre. Par exemple, conna^tre le sexe d'un individu permet d'en savoir un peu plus sur la longueur de ses cheveux. Attention, cela ne permet pas deconna^tremais juste d'avoir une information plus precise. Par exemple, dans l'UFR STAPS, 20% des individus ont les cheveux longs. Si on detaille selon les sexes, 4% des garcons ont les cheveux long contre 55% des lles. Conna^tre le sexe d'un individu ne donne donc aucune certitude, mais permet d'avoir un peu plus d'informations. Pour savoir si deux variables sont liees (avec un certain risque d'erreur, imcompres-

sible), on utilise un test. Le test a utiliser depend du type des variables et de leur proprietes :VariablesTest parame-

triqueDiagnosticTest non para- metriqueQualitative

Qualitative

21.Les v aleursd et outesl escase s

du tableau des eectifs atten- dus doivent ^etre superieures ou egales a 5.Test exact de Fi- sherQualitative (2 classes)& NumeriqueT de Student1.Les ecartt ypess ont egaux 2.

P ourc haquegr oupe,l av a-

riable numerique suit une loi normale OU les eectifs sont superieurs a 30.Test des rangs de

WilcoxonQualitative

(3 classes et plus)&

NumeriqueF de Fisher

(ANOVA)1.Les ecartt ypess ont egaux 2.

P ourc haquegr oupe,l av a-

riable numerique suit une loi normale OU les eectifs sont superieurs a 30.Test de Kruskal-

WallisNumerique

NumeriqueR de Pearson1.Au moi nsu ned esde uxv a-

riables suit une loi normale.R de Spearman

8CHAPITRE 1. RAPPELS THEORIQUES

Chapitre 2

Preparation des donnees

2.1 Telecharger

Avant de lire les donnees, ils vous faut R... Vous pouvez le telecharger sur le site du

CRAN :http:

cran.r-paoject.orgpuisDownload and Install R. Cliquez ensuite sur votre systeme d'exploitation (Linux, MacOS X ou Windows) puis telepcharger R en cliquant surbase.

2.2 Lecture des donnees

Excel etant un logiciel proprietaire, il est dicile a un autre logiciel de lire le format .xls. Par contre, R sait lire les chiers au format.csv. Donc, nous allons preparer un chier.csv. 1. O uvrezv osdon neessou sE xcel,O penO ce,S PSS,SAS ... 2. D ansl em enuFichierouFile, il existe probablement une optionEnregistrer sousou Exporter. Choisissez le format.csv. Si votre logiciel demande des precisions, vous pouvez lui specier :separateur decimal="."etseparateur=";". S'il ne demande rien, tout va bien. Un chier.csvvient d'^etre cree dans votre repertoire. Pour le lire a partir de R, il faut lui preciser le repertoire de lecture. Cela se fait a partir de la fen^etre R, dans le menu

Fichier!Changer le repertoire courant.

Il est maintenant possible de lire vos donnees a partir de R gr^ace a l'instruction :>### Lecture des donnees>r ead.csv2("FormationR.csv")

id sexe age taille niveau departement UFR frereEtSoeur

1 1 F 22 1,7 L3 75 SJAP 0

2 2 F 20 1,66 L3 92 SEGMI 0

3 3 F L3 78 SEGMI 0

4 4 F 25 1,65 M2 75 SJAP 0

5 5 F 340 1,62 M2 92 STAPS 0

6 ... ... ... ... ... ... ... ...

rapportRisque transAvecPres rapportAge rapportSexuel scoreConnaissance

1 Non 19 Oui 3

2 Non Non 18 Oui

3 Oui Non 15 Oui 2

4 Non 17 Oui 1

5 Oui Non 21 Oui 3

6 ... ... ... ... ...

9

10CHAPITRE 2. PREPARATION DES DONNEES

Pour pouvoir manipuler ce chier (et faire des statistiques dessus), il faut le stocker dans une variable de type un peu special qu'on appelledata.frame. Cela se fait a l'aide de la

eche d'aectation<-. Pour stocker vos donnees dans la variabledata, tapez :>### Lecture des donnees avec stocakge>d ata< -r ead.csv2("FormationR.csv")

Il ne se passe rien a l'ecran, maisdatacontient maintenant vos donnees. Pour veriez que c'est bien le cas, tapez simplementdata. R ache alors le contenu dedata, c'est a dire vos donnees.>### Verification que les donnees sont en memoire>d ata id sexe age taille niveau departement UFR frereEtSoeur

1 1 F 22 1,7 L3 75 SJAP 0

2 2 F 20 1,66 L3 92 SEGMI 0

3 3 F L3 78 SEGMI 0

4 4 F 25 1,65 M2 75 SJAP 0

5 5 F 340 1,62 M2 92 STAPS 0

6 ... ... ... ... ... ... ... ...

rapportRisque transAvecPres rapportAge rapportSexuel scoreConnaissance

1 Non 19 Oui 3

2 Non Non 18 Oui

3 Oui Non 15 Oui 2

4 Non 17 Oui 1

5 Oui Non 21 Oui 3

6 ... ... ... ... ...

Le pire ennemi du statisticien, tous les enqu^eteurs le savent, est lavaleur manquante. En R, les valeurs manquantes sont codeesNAou. Dans votre chier.csv, le codage de la valeur manquante depend de votre logiciel : case vide pour Excel et Open oce, un point pour SAS,... Il faut donc preciser a R le type de valeur manquante qu'il va rencontrer dans le chier. Cela se fait en ajoutant l'optionna.string="codage_Manquante"dans la ligne de lecture. Ainsi, si votre.csva ete obtenu a partir d'Excel ou Open oce, l'instruction

de lecteure estread.csv2("nom_de_fichier.csv", na.string = "")>### Lecture des donnees en considerant les manquantes>d ata< -r ead.csv2("FormationR.csv",na.string="")

d ata id sexe age taille niveau departement UFR frereEtSoeur

1 1 F 22 1,7 L3 75 SJAP 0

2 2 F 20 1,66 L3 92 SEGMI 0

3 3 F L3 78 SEGMI 0

4 4 F 25 1,65 M2 75 SJAP 0

5 5 F 340 1,62 M2 92 STAPS 0

6 ... ... ... ... ... ... ... ...

rapportRisque transAvecPres rapportAge rapportSexuel scoreConnaissance

1 Non 19 Oui 3

2 Non Non 18 Oui

3 Oui Non 15 Oui 2

4 Non 17 Oui 1

5 Oui Non 21 Oui 3

6 ... ... ... ... ...

On constate que les cases vides ont ete remplacees par desNAou des. Si vous aviez utilise SAS, l'instuction auraitetedata <- read.csv2("nom_de_fichier.csv",na.string=".").

2.3. MANIPULATION D'UN DATA.FRAME11

2.3 Manipulation d'un data.frame

dataest un data.frame, c'est-a-dire un tableau contenant vos donnees. Chaque colonne du tableau contient une variable. Chaque ligne du tableau est un individu. Pour travailler sur une colonne precise (par exemple la deuxieme), tapezdata[,2]. Vous pouvez egale-

ment taper le nom du data.frame, puis le symbole $ suivi du nom de la colonne :>### Deuxieme colonne>d ata[,2]

[1] F F F F F F F F F F F F F [15] F F F F F F F F F F H H H [29] H H H H H H H H H H H H

Levels: F H

>### Colonne sexe>d ata$sexe [1] F F F F F F F F F F F F F [15] F F F F F F F F F F H H H [29] H H H H H H H H H H H H

Levels: F H

R ache le contenu de la colonne. Il indique egalement les modalites de la variable (Levels). Pour acceder a une ligne (par exemple la troisieme), tapezdata[3,]>### Troisieme ligne>d ata[3,] id sexe age taille niveau departement UFR frereEtSoeur rapportRisque

3 3 NA NA L3 78 SEGMI 0 Oui

transAvecPres rapportAge rapportSexuel scoreConnaissance

3 Non 15 Oui 2

Pour acceder a une colonne et une ligne, on combine les deux :data[3,2]nous donne la valeur du troisieme individu, deuxieme colonne;data$sexe[3]donne la troisieme valeur de la colonnesexe.>### Affichage d"une valeur precise>d ata[3,2] [1]

Levels: F H

d ata sexe[3] [1]

Levels: F H

2.4 Modication d'une valeur

La modication d'une valeur se fait gr^ace a l'operateur<-. L'instructiona <- 5a pour eet de creer la variableaet de placer la valeur 5 dans cette variable. Dans le cas d'un data.frame, on peut souhaiter modier une valeur particuliere. Par exemple, l'individu 5 a pour age340, ce qui semble plut^ot improbable. Apres verication, il s'agit simplement d'une erreur de saisie, la vraie valeur est 34. Il faut donc remplacer340par34. Cela se fait avec<-.

12CHAPITRE 2. PREPARATION DES DONNEES>### Variable age>d ata$age

[1] 22 20 NA 25 340 20 19 18 21 21 21 19 18 21 24 21 21 [18] 21 20 NA 19 NA 21 21 21 24 19 23 20 22 23 23 21 23 [35] 21 22 22 22 19 22 >### Cinquieme valeur de age>d ata$age[5] [1] 340 >### Modification de la cinquieme valeur>d ata$age[5]< -3 4 >### Verification>d ata$age [1] 22 20 NA 25 34 20 19 18 21 21 21 19 18 21 24 21 21 21 20 NA 19 NA 21 [24] 21 21 24 19 23 20 22 23 23 21 23 21 22 22 22 19 22 La cinquieme valeur de la colonneagea ete corrigee.

2.5 Type de variable

Chaque colonne correspond a une variable et a donc une type. Les dierents type de

variables statistique decrites section 1.2 page 5 correspondent aux types R suivant :En statistique Sous R

Nominalefactor

Ordonneeordered

Discretenumeric(ouinteger)

Continuenumeric(ouinteger)Quand R charge un cher en memoire (dansdata), il donne a chaque variable un type.

Pour conna^tre le type d'une variable, on utilisestr. Cela liste toutes les variables avec leur type, leurs modalites et les premieres observations.>### Le type des colonnes> str(data) "data.frame": 40 obs. of 13 variables:$ id : int 1 2 3 4 ... $ sexe : Factor w/ 2 levels "F","H": 1 1 NA 1 ... $ age : num 22 20 NA 25 ... $ taille : num 1.7 1.66 NA 1.65 ... $ niveau : Factor w/ 5 levels "L1","L2","L3",..: 3 3 3 5 ... $ departement : int 75 92 78 75 ... $ UFR : Factor w/ 3 levels "SEGMI","SJAP",..: 2 1 1 2 ... $ frereEtSoeur : int 0 0 0 0 ... $ rapportRisque : Factor w/ 2 levels "Non","Oui": 1 1 2 1 ... $ transAvecPres : Factor w/ 2 levels "Non","Oui": NA 1 1 NA ... $ rapportAge : int 19 18 15 17 ... $ rapportSexuel : Factor w/ 2 levels "Non","Oui": 2 2 2 2 ... $ scoreConnaissance: int 3 NA 2 1 ...

2.5. TYPE DE VARIABLE13

Dans un certain nombre de cas, R n'a pas possibilite de donner le type correct : il n'a aucun moyen d'identier les variables ordonnees (il les prend pour desfactor) car il ne connait pas la relation d'ordre qui s'applique. C'est par exemple le cas de la variable [niveau]. De m^eme, il ne peut pas identier une variable nominale dont les modalites seraient des chires (comme les numeros de departement). Nous allons donc devoir corriger ses choix. Pour transformer une variable numerique en facteur, il faut utiliser la fonction as.factor.as.factor(data$departement)permet de considerer la colonnedata$depar- tementnon plus comme une variable numerique mais comme une nominale. Toutefois, pour que la variable departement soit modiee de maniere durable au sein du data.frame, il faut remplacer la colonne departement par la variable avec son nouveau type. Encore une fois,

cela se fait avec l'operateur d'aectation<-:>### Modification du type de departement>d ata$departement< -as.factor(data$departement)Ainsi, la colonnedepartementdu data.framedata(a gauche de la

eche) est rempla- cee (laquotesdbs_dbs28.pdfusesText_34
[PDF] box plot excel 2016

[PDF] graphique boite ? moustache

[PDF] boite ? moustache libreoffice

[PDF] box plot excel 2013

[PDF] excel box plot

[PDF] boite ? moustache moyenne

[PDF] comment faire une boite ? moustache

[PDF] boite ? moustache exercice

[PDF] interpretation boxplot

[PDF] interprétation boxplot r

[PDF] boite ? moustache exemple

[PDF] exercice corrigé statistique 3ème

[PDF] exercice boite ? moustache

[PDF] matériel numération montessori

[PDF] leçon 60 70 80 90