[PDF] Lire ; Compter ; Tester avec R





Previous PDF Next PDF



Lire ; Compter ; Tester avec R

3.4 Représentation graphique . 4.2 Représentation graphique bivariée . ... De même il ne peut pas identifier une variable nominale dont les modalités.



VARIABLE DÉPENDANTE ET VARIABLE INDÉPENDANTE

Nous pouvons illustrer le lien entre ces deux variables par un graphique. y x. Page 2. CS des Découvreurs. Page 2.



Le langage de la carte

1ère partie théorique : sémiologie graphique et 1) Identifier la donnée. Variable quantitative. Variable qualitative. Relative. Variable.



Chapitre 4 : Régression linéaire

La variable Y est appelée variable dépendante ou variable à expliquer et les Au vue du graphique



IDENTIFICATION DE LA VARIABLE ET DU PHENOMENE ETUDIE

Demandez-vous si votre choix de graphique (courbe histogramme



Chapitre 3 Etude de la liaison entre deux variables Analyse

Indicateur numérique de sens et d'intensité : coefficient de corrélation. a ) Graphique : nuage de points (diagramme de dispersion scatter-plot). 1. Exemple 1.



analyse-R.pdf

26 avr. 2022 il n'existe pas encore d'interface graphique pour R équivalente à celle ... variable permettant d'identifier les hommes de plus de 60.



Fiches méthodes SVT Collège Louis Blanc

facteur (le facteur variable). exploiter des résultats sous forme de tableau graphique



l7 identifier les variables clés : - lanalyse structurelle

?Bien poser le problème et choisir la démarche. ? Les ateliers de prospective. ?Identifier les variables clés. ? L'analyse structurelle et Micmac 



Méthodes daide à la décision

probabilités sur un graphique et de les visualiser comme des proportions. Nous traçons Identification des variables aléatoires et de leur distribution.



Variables et types de graphique - IBM

On peut tirer des informations d’un graphique en les présentant avec différentes étapes Présenter le graphique et extraire une valeur On doit donner la nature du document ici un graphique On doit lire le titre de l’axe vertical et de l’axe horizontal et rédiger une phrase du type :



FICHE MÉTHODE : Lire et analyser un graphique

Un graphique est une façon de présenter des données chiffrées sous une forme plus visuelle qui facilite leur compréhension I Lire le graphique 1) Il faut repérer 3 choses : le titre la grandeur variable et la grandeur mesurée Il met en relati grandeur mesurée et la Elle est toujours sur l’axe vertical



Fiche méthode : Lire et exploiter un graphique - Planète bleue

1ère étape : Lire un graphique 1 Identifier le titre la grandeur variable la grandeur mesurée et les unités 2 Indiquer les coordonnées d'un point remarquable : Pour chaque valeur de la grandeur variable (axe des abscisses horizontal) correspond une valeur de la grandeur mesurée (axe des ordonnées vertical) Pour la trouver il faut :

  • Créez Des Graphiques

    Voici le code qui permet de représenter une variable quantitative et une variable qualitative. Tout d'abord, créez le sous-échantillon sur lequel vous souhaitez travailler en adaptant ce code, notamment les variables X et Y selon la question que vous aurez choisie parmi celles ci-dessus. Ensuite, ces quelques lignes de code affichent votre graphiqu...

  • Évaluez Notre Modèle : Les Variables sont-elles corrélées ?

    Notre modèle est-il de qualité ? Prévoit-on correctement les montants des opérations uniquement à partir de leur catégorie ? Comme au chapitre précédent, on espère que notre modèle parvienne à expliquer un gros pourcentage des variations des données. Si c'est le cas, cela signifie que les variables categ et montantsont fortement corrélées. Pour éva...

  • à Vous de Jouer

    On va aller plus loin en analysant la corrélation entre la variable quart_mois créée précédemment et le montantdes achats. En effet, il serait intéressant de déterminer si certains jours sont plus "propices" à la dépense que d'autres et pourquoi pas, essayer de dégager les raisons !

Comment afficher les variables sur un graphique ?

Si vous souhaitez seulement afficher les variables sur des axes différents, transposez plutôt le graphique. La transposition consiste à permuter les axes du graphique. Pour plus d'informations, voir Transposition d'un graphique. Utilisation de l'onglet Variables

Comment lire un graphique ?

FICHE MÉTHODE : Lire et analyser un graphique Un graphique est une façon de présenter des données chiffrées sous une forme plus visuelle qui facilite leur compréhension. I. Lire le graphique 1) Il faut repérer 3 choses : le titre, la grandeur variable et la grandeur mesurée.

Où trouver la grille des variables ?

Grille des variables :La grille des variables apparaît sous la liste déroulante Type d'élément. Elle vous permet de changer les rôles des variables du graphique. Le rôle définit la manière dont une variable est utilisée dans le graphique. Par exemple, vous pouvez changer une variable de panneaux en variable de classification.

Comment représenter une variable quantitative et une variable qualitative ?

Voici le code qui permet de représenter une variable quantitative et une variable qualitative. Tout d'abord, créez le sous-échantillon sur lequel vous souhaitez travailler en adaptant ce code, notamment les variables X et Y selon la question que vous aurez choisie parmi celles ci-dessus.

Lire ; Compter ; Tester... avec R

Preparation des donnees / Analyse univariee / Analyse bivariee

Christophe Genolini

2

Table des matieres

1 Rappels theoriques 5

1.1 Vocabulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5

1.2 Nature d'une variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5

1.3 Principe de l'analyse univariee . . . . . . . . . . . . . . . . . . . . . . . . .

6

1.4 Principe de l'analyse bivariee . . . . . . . . . . . . . . . . . . . . . . . . . .

6

2 Preparation des donnees 9

2.1 Telecharger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

2.2 Lecture des donnees . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

9

2.3 Manipulation d'un data.frame . . . . . . . . . . . . . . . . . . . . . . . . . .

11

2.4 Modication d'une valeur . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

2.5 Type de variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

3 Analyse univariee 15

3.1 Eectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15

3.2 Centralite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

3.2.1 Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

3.2.2 Mediane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

3.2.3 Moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

3.3 Dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

3.3.1 Quartiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

3.3.2Ecart type et variance . . . . . . . . . . . . . . . . . . . . . . . . . .19

3.4 Representation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

3.4.1 Diagramme en baton . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

3.4.2 Histogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

20

3.4.3 Bo^te a moustaches . . . . . . . . . . . . . . . . . . . . . . . . . . . .

21

3.4.4 Export d'un graphique . . . . . . . . . . . . . . . . . . . . . . . . . .

22

4 Analyse bivariee 23

4.1 Eectifs, centralite et dispersion . . . . . . . . . . . . . . . . . . . . . . . .

23

4.2 Representation graphique bivariee . . . . . . . . . . . . . . . . . . . . . . .

24

4.2.1 Deux qualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24

4.2.2 Qualitative & numerique . . . . . . . . . . . . . . . . . . . . . . . .

24

4.2.3 Deux numeriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

4.3 Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

4.3.1 Qualitative & Qualitative . . . . . . . . . . . . . . . . . . . . . . . .

25

4.3.2 Qualitative (2 classes) & Numerique . . . . . . . . . . . . . . . . . .

27

4.3.3 Qualitative (3 classes et plus) & Numerique . . . . . . . . . . . . . .

29

4.3.4 Numerique & Numerique . . . . . . . . . . . . . . . . . . . . . . . .

30
3

4TABLE DES MATIERES

Chapitre 1

Rappels theoriques

1.1 VocabulaireNomDenitionExemple

IndividuObjet etudieun etudiant

PopulationEnsemble des individustous les etudiants participant a l'ex- perienceVariablesCe qui est etudie chez les individus (et qui varie d'un individu a l'autre)[Age],[CigaretteJour],[Ni- veauSportif]Modalites (d'une variable)Liste de toutes les valeurs possibles pour une variableModalites de[Age]: de 0 ans a 120 ansObservationValeurs prises par un individu par- ticulierMarc a 21 ans,(21)est une obser- vation.1.2 Nature d'une variable La nature d'une variable determine le type d'outil statistique qu'on pourra utiliser sur la variable. Pour determiner son type, il faut se demander ce qu'on peut faire avec ses observations : 5

6CHAPITRE 1. RAPPELS THEORIQUES1.3 Principe de l'analyse univariee

L'analyse univariee permet de mieux apprehender une variable. Elle comporte quatre etapes : 1.

Cal culde se ectifs

2.

Cal culde la c entralite

3.

Cal culde la d ispersion

4.

Rep resentationgrap hique

Ces etapes varient selon le type de variable. Voila le detail des etapes en fonction du type de variable :

EtapeNominaleOrdonneeDiscreteContinue

1. EectifsA faireA faireA faireInutile

2. CentraliteModeMedianeMoyenne et

MedianeMoyenne et

Mediane3. DispersionN'existe pasQuartile

Ecart type et

quartiles

Ecart type et

quartile4. GraphiqueHistogramme des eectifsHistogramme des eectifsHistogramme des eec- tifs, bo^te a moustacheDistribution et bo^te a mous- tache1.4 Principe de l'analyse bivariee L'analyse bivariee consiste a etudier deux variables conjointement, puis eventuellement a tester le lien entre les deux variables.

1.4. PRINCIPE DE L'ANALYSE BIVARI

EE7 Deux variables sont liees si conna^tre l'une donne des informations sur l'autre. Par exemple, conna^tre le sexe d'un individu permet d'en savoir un peu plus sur la longueur de ses cheveux. Attention, cela ne permet pas deconna^tremais juste d'avoir une information plus precise. Par exemple, dans l'UFR STAPS, 20% des individus ont les cheveux longs. Si on detaille selon les sexes, 4% des garcons ont les cheveux long contre 55% des lles. Conna^tre le sexe d'un individu ne donne donc aucune certitude, mais permet d'avoir un peu plus d'informations. Pour savoir si deux variables sont liees (avec un certain risque d'erreur, imcompres-

sible), on utilise un test. Le test a utiliser depend du type des variables et de leur proprietes :VariablesTest parame-

triqueDiagnosticTest non para- metriqueQualitative

Qualitative

21.Les v aleursd et outesl escase s

du tableau des eectifs atten- dus doivent ^etre superieures ou egales a 5.Test exact de Fi- sherQualitative (2 classes)& NumeriqueT de Student1.Les ecartt ypess ont egaux 2.

P ourc haquegr oupe,l av a-

riable numerique suit une loi normale OU les eectifs sont superieurs a 30.Test des rangs de

WilcoxonQualitative

(3 classes et plus)&

NumeriqueF de Fisher

(ANOVA)1.Les ecartt ypess ont egaux 2.

P ourc haquegr oupe,l av a-

riable numerique suit une loi normale OU les eectifs sont superieurs a 30.Test de Kruskal-

WallisNumerique

NumeriqueR de Pearson1.Au moi nsu ned esde uxv a-

riables suit une loi normale.R de Spearman

8CHAPITRE 1. RAPPELS THEORIQUES

Chapitre 2

Preparation des donnees

2.1 Telecharger

Avant de lire les donnees, ils vous faut R... Vous pouvez le telecharger sur le site du

CRAN :http:

cran.r-paoject.orgpuisDownload and Install R. Cliquez ensuite sur votre systeme d'exploitation (Linux, MacOS X ou Windows) puis telepcharger R en cliquant surbase.

2.2 Lecture des donnees

Excel etant un logiciel proprietaire, il est dicile a un autre logiciel de lire le format .xls. Par contre, R sait lire les chiers au format.csv. Donc, nous allons preparer un chier.csv. 1. O uvrezv osdon neessou sE xcel,O penO ce,S PSS,SAS ... 2. D ansl em enuFichierouFile, il existe probablement une optionEnregistrer sousou Exporter. Choisissez le format.csv. Si votre logiciel demande des precisions, vous pouvez lui specier :separateur decimal="."etseparateur=";". S'il ne demande rien, tout va bien. Un chier.csvvient d'^etre cree dans votre repertoire. Pour le lire a partir de R, il faut lui preciser le repertoire de lecture. Cela se fait a partir de la fen^etre R, dans le menu

Fichier!Changer le repertoire courant.

Il est maintenant possible de lire vos donnees a partir de R gr^ace a l'instruction :>### Lecture des donnees>r ead.csv2("FormationR.csv")

id sexe age taille niveau departement UFR frereEtSoeur

1 1 F 22 1,7 L3 75 SJAP 0

2 2 F 20 1,66 L3 92 SEGMI 0

3 3 F L3 78 SEGMI 0

4 4 F 25 1,65 M2 75 SJAP 0

5 5 F 340 1,62 M2 92 STAPS 0

6 ... ... ... ... ... ... ... ...

rapportRisque transAvecPres rapportAge rapportSexuel scoreConnaissance

1 Non 19 Oui 3

2 Non Non 18 Oui

3 Oui Non 15 Oui 2

4 Non 17 Oui 1

5 Oui Non 21 Oui 3

6 ... ... ... ... ...

9

10CHAPITRE 2. PREPARATION DES DONNEES

Pour pouvoir manipuler ce chier (et faire des statistiques dessus), il faut le stocker dans une variable de type un peu special qu'on appelledata.frame. Cela se fait a l'aide de la

eche d'aectation<-. Pour stocker vos donnees dans la variabledata, tapez :>### Lecture des donnees avec stocakge>d ata< -r ead.csv2("FormationR.csv")

Il ne se passe rien a l'ecran, maisdatacontient maintenant vos donnees. Pour veriez que c'est bien le cas, tapez simplementdata. R ache alors le contenu dedata, c'est a dire vos donnees.>### Verification que les donnees sont en memoire>d ata id sexe age taille niveau departement UFR frereEtSoeur

1 1 F 22 1,7 L3 75 SJAP 0

2 2 F 20 1,66 L3 92 SEGMI 0

3 3 F L3 78 SEGMI 0

4 4 F 25 1,65 M2 75 SJAP 0

5 5 F 340 1,62 M2 92 STAPS 0

6 ... ... ... ... ... ... ... ...

rapportRisque transAvecPres rapportAge rapportSexuel scoreConnaissance

1 Non 19 Oui 3

2 Non Non 18 Oui

3 Oui Non 15 Oui 2

4 Non 17 Oui 1

5 Oui Non 21 Oui 3

6 ... ... ... ... ...

Le pire ennemi du statisticien, tous les enqu^eteurs le savent, est lavaleur manquante. En R, les valeurs manquantes sont codeesNAou. Dans votre chier.csv, le codage de la valeur manquante depend de votre logiciel : case vide pour Excel et Open oce, un point pour SAS,... Il faut donc preciser a R le type de valeur manquante qu'il va rencontrer dans le chier. Cela se fait en ajoutant l'optionna.string="codage_Manquante"dans la ligne de lecture. Ainsi, si votre.csva ete obtenu a partir d'Excel ou Open oce, l'instruction

de lecteure estread.csv2("nom_de_fichier.csv", na.string = "")>### Lecture des donnees en considerant les manquantes>d ata< -r ead.csv2("FormationR.csv",na.string="")

d ata id sexe age taille niveau departement UFR frereEtSoeur

1 1 F 22 1,7 L3 75 SJAP 0

2 2 F 20 1,66 L3 92 SEGMI 0

3 3 F L3 78 SEGMI 0

4 4 F 25 1,65 M2 75 SJAP 0

5 5 F 340 1,62 M2 92 STAPS 0

6 ... ... ... ... ... ... ... ...

rapportRisque transAvecPres rapportAge rapportSexuel scoreConnaissance

1 Non 19 Oui 3

2 Non Non 18 Oui

3 Oui Non 15 Oui 2

4 Non 17 Oui 1

5 Oui Non 21 Oui 3

6 ... ... ... ... ...

On constate que les cases vides ont ete remplacees par desNAou des. Si vous aviez utilise SAS, l'instuction auraitetedata <- read.csv2("nom_de_fichier.csv",na.string=".").

2.3. MANIPULATION D'UN DATA.FRAME11

2.3 Manipulation d'un data.frame

dataest un data.frame, c'est-a-dire un tableau contenant vos donnees. Chaque colonne du tableau contient une variable. Chaque ligne du tableau est un individu. Pour travailler sur une colonne precise (par exemple la deuxieme), tapezdata[,2]. Vous pouvez egale-

ment taper le nom du data.frame, puis le symbole $ suivi du nom de la colonne :>### Deuxieme colonne>d ata[,2]

[1] F F F F F F F F F F F F F [15] F F F F F F F F F F H H H [29] H H H H H H H H H H H H

Levels: F H

>### Colonne sexe>d ata$sexe [1] F F F F F F F F F F F F F [15] F F F F F F F F F F H H H [29] H H H H H H H H H H H H

Levels: F H

R ache le contenu de la colonne. Il indique egalement les modalites de la variable (Levels). Pour acceder a une ligne (par exemple la troisieme), tapezdata[3,]>### Troisieme ligne>d ata[3,] id sexe age taille niveau departement UFR frereEtSoeur rapportRisque

3 3 NA NA L3 78 SEGMI 0 Oui

transAvecPres rapportAge rapportSexuel scoreConnaissance

3 Non 15 Oui 2

Pour acceder a une colonne et une ligne, on combine les deux :data[3,2]nous donne la valeur du troisieme individu, deuxieme colonne;data$sexe[3]donne la troisieme valeur de la colonnesexe.>### Affichage d"une valeur precise>d ata[3,2] [1]

Levels: F H

d ata sexe[3] [1]

Levels: F H

2.4 Modication d'une valeur

La modication d'une valeur se fait gr^ace a l'operateur<-. L'instructiona <- 5a pour eet de creer la variableaet de placer la valeur 5 dans cette variable. Dans le cas d'un data.frame, on peut souhaiter modier une valeur particuliere. Par exemple, l'individu 5quotesdbs_dbs26.pdfusesText_32
[PDF] représentation graphique fonction en ligne

[PDF] graphique fonction abscisse ordonnée

[PDF] sécurité physique salle informatique

[PDF] porter plainte pour insulte et menace

[PDF] qcm vecteurs seconde

[PDF] modele de rapport dagression au travail

[PDF] porter plainte pour menace verbale

[PDF] qcm maths seconde probabilités

[PDF] porter plainte pour agression verbale et menace

[PDF] porter plainte pour menace et intimidation

[PDF] consequence d'une plainte pour menace

[PDF] conséquence pour plainte de menace de mort

[PDF] f(x)=x-ln(x^2+1) bac

[PDF] suite un+1=f(un) avec f decroissante

[PDF] f(x)=racine de x