[PDF] Logiciel R et programmation 21-Oct-2015 bases du





Previous PDF Next PDF



Fondamentaux des mathématiques 1

L'objectif de ce cours est de faire une transition entre les Table des matières. Sommaire. 1. 0 Conseils pour bien commencer ... 2 Bases de logique.



Administrez vos bases de données avec MySQL - Zeste de Savoir

12-May-2020 Table des matières .1. Quelques exemples d'applications ... I. MySQL et les bases du langage SQL ... I.4. Création d'une base de données.



Guide pour la rédaction dun travail universitaire de 1er 2e et 3e

1. Tâches à effectuer avant pendant et après la rédaction . ANNEXE I : Exemple d'une table des matières .



Modélisation de la tôlerie dans Solid Edge

4-1. Création de la fonction technologique de base . Sélectionnez ensuite l'entrée de table de matières et cliquez sur le bouton Modifier.



Cours PHP Accéléré

12-Jul-2022 4.18 Connexion aux bases de données depuis PHP avec PDO. 4.18.1 Une table simple en SQL : CREATE TABLE `CARNET` (.



Guide dutilisation du système central dIBM SPSS Statistics 28

1. Noms de variables et libellés de variable dans les listes de boîtes de dialogue. Si une table comporte un ou plusieurs champs sélectionnés ...



BASES DE DONNÉES ET MODÈLES DE CALCUL

Table des matières. 20.2.1 Énoncé. 414. 20.2.2 Construction du modèle abstrait. 414. 20.2.3 Implantation du modèle dans une feuille de calcul.



Logiciel R et programmation

21-Oct-2015 bases du langage et du logiciel R. Le lecteur initié peut ... Table des matières. 1 Introduction. 1. 1.1 Historique . ... 1.2.4 L'aide .



REGLES DE BASE POUR LETALAGE DES PRODUITS par Urban

REGLES DE BASE POUR L'ETALAGE DES PRODUITS Table des matières ... En utilisant ce fascicule d'instruction vous pouvez apprendre les REGLES. DE BASE DE ...



Français de base de la 4e à la 6e année - Tout le monde à table

04-Jan-2017 La meilleure façon d'apprendre une langue est de ... Le Français de base est une matière facultative dans le cadre du programme anglais.

Ewen Gallic

1 http://egallic.fr2015LogicielRet programmation1. ewen.gallic[at]gmail.com

Avant-propos

Ces notes de cours ont été réalisées dans le cadre d"un enseignement d"introduction àRadressé à

des étudiants du Master de Statistique et Économétrie de la Faculté des Sciences Économiques

de l"Université de Rennes 1.

Objectifs

Cet ouvrage a pour but l"initiation au logiciel statistique et au langage informatique portant le même nom,R, afin d"être capable de s"en servir de manière efficace et autonome. Le lecteur peut exécuter tous les exemples fournis (et est vivement encouragé à le faire). Des exercices viennent clore certains chapitres. Les corrections sont disponibles en ligne à l"adresse suivante :http://egallic.fr/enseignement/.

À qui s"adressent ces notes?

Dans un premier temps, cet ouvrage s"adresse aux débutants qui souhaientent apprendre les

bases du langage et du logicielR. Le lecteur initié peut également s"appuyer sur ces notes afin

d"y retrouver des rappels sur les notions basiques.

Remerciements

Ce manuel est le produit de plusieurs années de pratique, qui ont débutées en 2011 grâce à

Christophe Cariou, que je tiens à remercier pour m"avoir soufflé l"idée d"utiliserRpour réaliser

des projets amusants sur lesquels nous avons travaillés. Un énorme merci à Arthur Charpentier

pour la quantité de savoir et d"astuces fournis sur l"utilisation deR, et qui est à l"origine de

nombreux exemples présents dans ces notes de cours. Merci aussi à François Briatte de m"avoir

introduit à de nouveaux horizons dans le langage, et aussi à Gauthier Vermandel pour ses nombreux conseils. Merci également à Julien-Yacine Chaqra pour ses suggestions et relectures. Enfin, merci à toute la communautéRd"exister et de proposer ce partage de savoir librement et gratuitement. ii

Table des matières

1 Introduction1

1.1 Historique

1

1.2 Présentation de l"espace de travail

1

1.2.1 La console et les fenêtres de script

1

1.2.2 Les variables

2

1.2.2.1 Assignation

2

1.2.2.2 Conventions de nommage

3

1.2.2.3 Les objets en mémoire

3

1.2.2.4 Modification, suppression

4

1.2.3 Lespackages. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4

1.2.4 L"aide

5

1.3 Un environnement de développement : RStudio

6

2 Données7

2.1 Types de données

7

2.1.1 Mode

7

2.1.2 Longueur

9

2.1.3 Données manquantes

9

2.1.4 L"objet vide

9

2.2 Structure des données

10

2.2.1 Structures de base

10

2.2.1.1 Vecteurs

10

2.2.1.2 Facteurs

11

2.2.1.3 Dates

12

2.2.1.4 Matrices

15

2.2.1.5 Listes

17

2.2.2 Bases de données

18

2.2.2.1 Data frames

18

2.2.2.2 Data table

19

2.3 Importation, exportation et création de données

20

2.3.1 Importation

20

2.3.1.1 La fonctionread.table. . . . . . . . . . . . . . . . . . . . . . .20

2.3.1.2 La fonctionscan. . . . . . . . . . . . . . . . . . . . . . . . . . .22

2.3.1.3 La fonctionread.fwf. . . . . . . . . . . . . . . . . . . . . . . .23

iii

TABLE DES MATIÈRES

2.3.1.4 Importation depuis Excel©. . . . . . . . . . . . . . . . . . . . .24

2.3.1.5 Importation depuis d"autres formats

25

2.3.2 Exportation

25

2.3.3 Génération

26

2.3.3.1 Séquences régulières

26

2.3.3.2 Séquences pseudo-aléatoires

28

2.4 Manipulation des données

29

2.4.1 Opérateurs

29

2.4.1.1 Opérateurs arithmétiques

30

2.4.1.2 Opérateurs de comparaison

30

2.4.1.3 Opérateurs logiques

31

2.4.1.4 Attention au recyclage

32

2.4.2 Accès aux valeurs, modifications

33

2.4.2.1 Accès par indices

33

2.4.2.2 Accès par noms

38

2.4.3 Chaînes de caractères

41

2.4.3.1 Concaténation

41

2.4.3.2 Conversion en majuscules ou minuscules

43

2.4.3.3 Compter le nombre de caractères d"une chaîne

43

2.4.3.4 Extraction de sous-chaînes

44

2.4.3.5 Recherche de chaînes de caractères

46

2.4.3.6 Nettoyage, complétion

48

2.4.4 Dates

49

2.4.4.1 Extraction

49

2.4.4.2 Opérations

50

2.4.4.3 Intervalles de dates

53

2.4.4.4 Séquence de dates

56

2.4.4.5 Fuseaux horaires

57

2.4.4.6 Paramètres locaux

57

2.4.5 Calculs matriciels

59

2.4.5.1 Addition, soustraction

59

2.4.5.2 Multiplication, division

60

2.4.5.3 Déterminant, trace

62

2.4.6 Data frames

62

2.4.6.1 Sélection

62

2.4.6.2 Filtrage

64

2.4.6.3 Retirer les valeurs dupliquées

65

2.4.6.4 Modification des colonnes

65

2.4.6.5 Tri

70

2.4.6.6 Jointures

72

2.4.6.7 Agrégation

76

2.4.6.8 Stacking et unstacking

79

2.4.7 Data tables

83

2.4.7.1 Création, conversion

83

2.4.7.2 Sélection

84

2.4.7.3 Filtrage

85

2.4.7.4 Retirer les valeurs dupliquées

85

2.4.7.5 Clés

85

2.4.7.6 Modification des colonnes

88

2.4.7.7 Tri

88

2.4.7.8 Copie dedata.table. . . . . . . . . . . . . . . . . . . . . . . .89

iv

TABLE DES MATIÈRES

2.4.7.9 Jointures

90

2.4.7.10 Agrégation

91

2.4.8 Quelques fonctions utiles

93

2.5 Exercices

96

3 Fonctions102

3.1 Définition

102

3.2 La structure d"une fonction

103

3.2.1 Le corps d"une fonction

103

3.2.2 Les paramètres d"une fonction

105

3.2.2.1 Appel sans noms

105

3.2.2.2 Paramètres effectifs

105

3.2.2.3 Appel avec des noms partiels

106

3.2.2.4 Fonctions sans paramètres

106

3.2.2.5 La paramètre spécial.... . . . . . . . . . . . . . . . . . . . . .107

3.2.3 Portée des fonctions

107

3.3 Exercices

109

4 Boucles et calculs vectoriels

112

4.1 Les boucles

112

4.1.1 Les boucles avecwhile(). . . . . . . . . . . . . . . . . . . . . . . . . . .112

4.1.2 Les boucles avecfor(). . . . . . . . . . . . . . . . . . . . . . . . . . . .113

4.1.3 Les conditions

113

4.1.3.1 Les instructionsif...else. . . . . . . . . . . . . . . . . . . . .113

4.1.3.2 La fonctionswitch. . . . . . . . . . . . . . . . . . . . . . . . .114

4.1.4 L"instructionrepeat...,break. . . . . . . . . . . . . . . . . . . . . . .115

4.1.5 L"instructionnext...,break. . . . . . . . . . . . . . . . . . . . . . . . .115

4.1.6 Barre de progression

116

4.2 La vectorisation

116

4.2.1 Les fonctions du packageplyr. . . . . . . . . . . . . . . . . . . . . . . .117

4.2.1.1Arrayeninput:a*ply(). . . . . . . . . . . . . . . . . . . . . .118

4.2.1.2Data frameeninput:d*ply(). . . . . . . . . . . . . . . . . . .120

4.2.1.3Listeninput:l*ply(). . . . . . . . . . . . . . . . . . . . . . .122

4.2.1.4 Calcul parallèle

123

4.2.2 Les fonctions de la familleapplydu packagebase. . . . . . . . . . . . .124

4.2.2.1 La fonctionlapply. . . . . . . . . . . . . . . . . . . . . . . . .124

4.2.2.2 La fonctionsapply. . . . . . . . . . . . . . . . . . . . . . . . .126

4.2.2.3 La fonctionvapply. . . . . . . . . . . . . . . . . . . . . . . . .128

4.2.2.4 La fonctionapply. . . . . . . . . . . . . . . . . . . . . . . . . .128

4.2.2.5 La fonctiontapply. . . . . . . . . . . . . . . . . . . . . . . . .129

4.2.2.6 La fonctionmapply. . . . . . . . . . . . . . . . . . . . . . . . .130

4.2.3 La fonctionVectorize. . . . . . . . . . . . . . . . . . . . . . . . . . . . .131

4.3 Exercices

131

5 Graphiques

134

5.1 Structure

134

5.2 Des graphiques élaborés avecggplot(). . . . . . . . . . . . . . . . . . . . . . .135

5.2.1 Paramètres esthétiques

136

5.2.2 Paramètres géométriques (fonctionsgeom_*()). . . . . . . . . . . . . . . 139

5.2.2.1 Points

140

5.2.2.2 Lignes

141

5.2.2.3 Polygones

142
v

TABLE DES MATIÈRES

5.2.2.4 Boxplot

142

5.2.2.5 Gigue

143

5.2.2.6 Courbe de tendance

144

5.2.2.7 Histogramme

145

5.2.2.8 Densité

146

5.2.3 Paramètres statistiques (fonctionsstat_*()). . . . . . . . . . . . . . . . 147

5.2.4 Échelles (fonctionsscale_*()). . . . . . . . . . . . . . . . . . . . . . . . 150

5.2.5 Groupes

156

5.2.6 Annotations

157

5.2.6.1 Texte

158

5.2.6.2 Lignes

159

5.2.6.3 Rectangles

161

5.2.7 Positions

161

5.2.8 Facettes

162

5.2.8.1 La fonctionfacet_grid(). . . . . . . . . . . . . . . . . . . . .163

5.2.8.2 La fonctionfacet_wrap(). . . . . . . . . . . . . . . . . . . . .165

5.2.8.3 Échelles et facettes

166

5.2.9 Coordonnées

167

5.2.10 Titres, axes, légendes

169

5.3 Enregistrement des graphiques

172

5.4 Cartes

173

5.4.1 Récupérer des cartes toutes faites

173

5.4.1.1Packagerworldmap. . . . . . . . . . . . . . . . . . . . . . . . .173

5.4.1.2Packagemaps. . . . . . . . . . . . . . . . . . . . . . . . . . . . .174

5.4.1.3 Fichiershapefile. . . . . . . . . . . . . . . . . . . . . . . . . .177

5.4.2 Carte choroplèthe

178

5.5 Graphiques en 3D

179

5.6 Exercices

181

6 Régressions linéaires avecR186

6.1 Rappels

186

6.2 Données de l"exemple

187

6.3 Estimation des paramètres

190

6.4 Lecture des sorties

191

6.5 Extractions

192

6.6 Variables catégorielles

194

6.7 Tests de nullité des coefficients et intervalles de confiance

195

6.8 Prévisions

197

6.9 Exportation des résultats

199

6.10 Exercices

200

7 Expressions régulières

202

7.1 Les recherches basiques

202

7.2 Les classes de caractères

205

7.3 Les quantificateurs

209

7.4 Les métacaractères

210

7.5 Fonctions d"extraction

210

7.6 Quelques fonctions dupackagestringr. . . . . . . . . . . . . . . . . . . . . . .210

7.6.1 La fonctionstr_detect(). . . . . . . . . . . . . . . . . . . . . . . . . . .211

7.6.2 La fonctionstr_extract(). . . . . . . . . . . . . . . . . . . . . . . . . .211

7.6.3 La fonctionstr_extract_all(). . . . . . . . . . . . . . . . . . . . . . .211

7.6.4 La fonctionstr_match(). . . . . . . . . . . . . . . . . . . . . . . . . . .212

vi

TABLE DES MATIÈRES

7.6.5 La fonctionstr_match_all(). . . . . . . . . . . . . . . . . . . . . . . . .212

7.6.6 La fonctionstr_locate(). . . . . . . . . . . . . . . . . . . . . . . . . . .213

7.6.7 La fonctionstr_locate_all(). . . . . . . . . . . . . . . . . . . . . . . .214

7.6.8 La fonctionstr_replace(). . . . . . . . . . . . . . . . . . . . . . . . . .215

7.6.9 La fonctionstr_replace_all(). . . . . . . . . . . . . . . . . . . . . . .215

7.6.10 La fonctionstr_split(). . . . . . . . . . . . . . . . . . . . . . . . . . .215

7.6.11 La fonctionstr_string_fixed(). . . . . . . . . . . . . . . . . . . . . . .216

Références217

Index des expressionsR219

vii

TABLE DES MATIÈRES

viii 1

Introduction

Ce document est construit principalement à l"aide des références suivantes :

Lafa yede Mic heaux

et al. 2011

F arnsworth

2008

Charp entier

2014

Zuur et al.

2009

P aradis

2002
) et

Goulet

2014

1.1 Historique

Dans le milieu des années 1970, une équipe de chercheurs de AT&T Bell Laboratories, composée

de John Chambers, Douglas Bates, Rick Becker, Bill Cleveland, Trevor Hastie, Daryl Pregibon

et Allan Wilks, développe un langage de programmation appeléS(la lettreSfaisant référence à

statistics). Il s"agit d"un langage permettant de manipuler les données et d"effectuer des analyses

statistiques et graphiques. Dans le milieu des années 1990, Ross Ihaka et Robert Gentleman

créént leRau département de Statistiques de l"Université d"Auckland. Ce langage et logiciel,

inspiré duSet deSchemeest distribué sous les termes de la GNUGeneral Public Licence. La RDevelopment Core Teamse charge de distribuer et de développer le logicielR. De nombreux contributeurs à travers le monde participent au développement deR.

1.2 Présentation de l"espace de travail

1.2.1 La console et les fenêtres de script

Rest un langage interprété, c"est-à-dire qu"il nécessite un interprète pour exécuter les com-

mandes, et n"a pas de phase de compilation. Il existe plusieurs façons de travailler avecR: soit directement dans la console (qui est un interprète), soit dans une fenêtre de script (Fig 1.1 La seconde méthode est fortement conseillée, puisqu"elle permet de sauvegarder le code et d"y

accéder facilement pour une utilisation utlérieure. De plus, il existe souvent des raccourcis cla-

viers, en fonction de l"éditeur utilisé, qui permettent de soumettre le code de la fenêtre de script

à l"interprète. Les fichiers de code que l"on sauvegardent possèdent l"extension ".R".

Dans la console, à la fin de l"affichage d"ouverture de sessionR, se trouve le caractère>(prompt),

invitant l"utilisateur à inscrire une commande. Les expressions sont évaluées une fois qu"elle sont

soumises (à l"aide de la toucheENTREE) et le résultat est donné, lorsqu"il n"y a pas d"erreur dans

le code, juste en dessous : 1

1. INTRODUCTION

2 1 ## [1] 3Figure1.1 - Console et fenêtre de script sous Mac OS X Par la suite, le symbole d"invite de commande ne sera plus affichée dans les cadres de code, afin de permettre au lecteur de reproduire facilement les résultats obtenus en copiant et collant les instructions. Par ailleurs, dans ce document, contrairement à ce que l"on peut observer dans la

consoleR, le résultat de l"évalutation de l"expression "2+1" est précédé de deux symboles dièses.

Le symbole#indique àRde ne pas evaluer le code qui suit, jusqu"à la fin de la ligne. Il permet donc de placer des lignes en commentaires.# Des commentaires 2 1# +1 ## [1] 3 Lorsque l"on travaille dans une fenêtre de script, la combinaison de touches pour soumettre le

code dépend du système d"exploitation et de l"éditeur de texte utilisé (CTRL+Rsous Windows,

CMD+ENTERsous Mac OS).

1.2.2 Les variables

1.2.2.1 Assignation

De base, le résultat d"une évaluation n"est pas enregistré, et est de fait perdu une fois affiché.

Cependant, dans la plupart des cas, il est utile de conserver la sortie dans une variable. Il

suffit alors d"attribuer un nom et un contenu à un objet. La flèche d"affectation<-permet cela.

L"affichage du contenu de l"objetxse fait en inscrivant son nom et en l"évaluant. 2

1.2. PRÉSENTATION DE L"ESPACE DE TRAVAIL

x 2 1 x ## [1] 3Remarque 1.2.1 Il est possible d"afficher le contenu de l"objet en entourant l"expression de son affectation à une valeur par des parenthèses :(x<- 2 +1) ## [1] 3Remarque 1.2.2 Comme de nombreux langages de programmation utilisent le symbole=pour assigner une valeur à un objet, cette pratique est permise dans beaucoup de cas enR, mais il arrive

qu"elle ne produise pas l"effet escompté dans d"autres cas de figures.1.2.2.2 Conventions de nommage

Le nom d"une variable doit être composé de caractères alphanumériques ou du point ou du trait de soulignement uniquement. Il ne doit pas commencer par un chiffre ou contenir d"espace, sauf s"il est entouré par des guillemets. Il est important de noter que ces noms sont sensibles

à la casse, c"est à dire qu"une distinction entre les majuscules et les minuscules a lieu. Il existe

plusieurs pratiques pour nommer des variables, et il n"est pas rare de voir des combinaisons de

ces pratiques. Un billet de Robin Lovelace explique les différences entre les méthodes et propose

d"en adopter une seule (

Lovelace

2014
•tout en minuscule : nomvariable; •séparation par un point : nom.variable; •séparation par un trait de soulignement : nom_variable; •lowerCamelCase, avec la première lettre en minuscule : nomVariable; •PascalCase, avec la première lettre en majuscule : NomVariable. Robin Lovelace propose d"avoir recours aux traits de soulignement, pour la facilité de lecture qu"ils permettent, et par leur emploi par quelques grands noms de la communautéR(comme

Hadley Wickham

1ou Yihui Xie2).

1.2.2.3 Les objets en mémoire

Pour lister les éléments de la sessionRstockés en mémoire de l"ordinateur, il faut appeler la

fonctionls():ls() ## [1] "x"1.http://had.co.nz/

2.http://yihui.name/

3

1. INTRODUCTION

1.2.2.4 Modification, suppression

quotesdbs_dbs35.pdfusesText_40
[PDF] T le. Se documenter tout au long de l année. séquence pédagogique L1.2 L1.4 L2.2 L4.2. 3 e trimestre. Nom :... Prénom :... Date :...

[PDF] T.P. 7 : Définir et contrôler un système d allumage statique

[PDF] Tabac. Le tabac : j arrête, je respire

[PDF] Table des matières TABLE DES MATIÈRES... 1 PRÉAMBULE... 4 INTRODUCTION... 4 OBJECTIF GÉNÉRAL... 5 SERVICES DISPONIBLES... 5 DÉFINITIONS...

[PDF] Table des matières. 1 Avant-propos. 2 Introduction. 5 La mise en œuvre de la loi sur le développement durable au Palais des congrès de Montréal

[PDF] Table des matières. 2 www.csdhr.qc.ca Commission scolaire des Hautes-Rivières Août 2012

[PDF] Table des matières. Champ d application 25 Section 1 Portée 25 Section 2 Commercialité 29

[PDF] Table des matières. Introduction aux réformes des institutions judiciaires : panorama d un nouveau monde 9

[PDF] Table des matières. Introduction Chef de projet : un métier complexe... 1. Diagnostiquer sa gestion de projet... 19

[PDF] TABLE DES MATIÈRES. Première partie DEVENIR DE «GRANDES ÉCOLES» FIN DU XIX e SIÈCLE 1979

[PDF] TABLE DES MATIÈRES. Remerciements... 9 Préface... 11 Sommaire... 13 Liste des principales abréviations... 15 Introduction... 19

[PDF] TABLE DES MATIÈRES. Remerciements... 9 Préface... 11 Sommaire... 13 Principales abréviations... 15 Introduction générale... 17

[PDF] Table des matières. Sous-section 1. Le droit commun 9 Sous-section 2. Le régime dérogatoire au profit du travailleur 9

[PDF] TABLE DES MOTS DU DICOPROPRIETE

[PDF] table des sommaire matières