[PDF] Le logiciel R Notez que les exercices et





Previous PDF Next PDF



Oracle Business Intelligence Enterprise Edition - Guide de lutilisateur

Comment Oracle BI EE interagit-il avec d'autres produits ? plates-formes les bases de données et pour obtenir d'autres informations. Ces deux.



Non classifié DSTI/ICCP/IIS(2005)1/FINAL Groupe de travail sur les

2 déc. 2005 confiance que les utilisateurs accordent aux plates-formes applications et services. La création d'un environnement en ligne renforçant la ...



Les plateformes Internet comme intermédiaires hybrides du marché

1 mar. 2017 consommer et de travailler avec les dispositifs Internet. ... s'accompagne d'une montée en puissance de nouvelles formes d'activités.



Gestion et extension automatiques du dictionnaire relationnel

6 déc. 2017 propres Prolexbase Mise à jour multilingues et création d'un volume arabe via la Wikipedia. Infor- matique [cs].



ETAT DE LART – ENQUETE (AVRIL 2021)

3 mai 2021 La transformation digitale prend plusieurs formes peut concerner tous les acteurs au sein d'une même entreprise (processus opérationnels



Le logiciel R

Notez que les exercices et les travaux pratiques doivent être traités uniquement avec les notions apprises dans les chapitres pré- cédents. La trame 



Les cahiers du programmeur - Java EE 5.pdf

2e édition 2007 360 p. avec CD-Rom. Créer son blog en 5 minutes. ... au langage Java une plate-forme logicielle robuste pour les applications.





Numéro 71

23 mar. 2006 partenariat avec l'Assemblée des chambres de commerce signé en ... disposition une plate-forme facilitant la recherche d'information".



Le logicielR

Ma^triser le langage

Eectuer des analyses

(bio)statistiquesPierre Lafaye de Micheaux R

´emy Drouilhet

Benoit Liquet

A Dominique, a Luka et a MathiasA mes parents

A tous ceux qui ont contribue, contribuent et contribueront a eveiller nos consciences

A Pierre et a sa perseverance

Avant-propos

Cet ouvrage est fonde sur les notes d'un cours dispense pendant quelques annees a l'Institut universitaire de technologie de Grenoble 2, au sein du depar- tement Statistique et informatique decisionnelle (STID). Il a donc ete pour la premiere fois, dans une version tres imparfaite, par les etudiants de ce departement que nous remercions ici. Sans l'inter^et temoigne par ces derniers, cet ouvrage n'aurait probablement pas vu le jour. Nous voulons egalement vi- vement remercier notre collegue et ami Michel Lejeune, qui a reussi a nous convaincre de travailler a la redaction d'un manuscrit a soumettre aux edi- tions Springer. Nous souhaitons aussi souligner l'importance du hasard qui a permis que les trajectoires des trois auteurs de ce livre se croisent dans un m^eme lieu, pendant quelques annees. L'experience humaine et scientique qui a resulte de cette rencontre a ete tres enrichissante, et chacun des auteurs a pu apporter des competences complementaires ayant permis de venir a bout du travail considerable qu'a necessite la redaction de cet ouvrage. Nous tenons enn a remercier ici tres chaleureusement Matthieu Dubois, un collegue et ami, chercheur en psychologie experimentale et feru deRet de l'environnement Mac- intosh qui a ete le premier a lire ce livre dans sa version quasi nalisee et nous a conseille de nombreuses ameliorations. L'information contenue dans ce livre a ete choisie et organisee de la meilleure facon possible an d'^etreexhaustivetout en etant egalementassimilablepar le lecteur. Cet ouvrage peut ainsi servir comme support d'un cours sur le logiciel Ra un niveau de debutant a avance. Une emphase particuliere a ete mise sur la forme du livre, ce qui, a notre sens, permet d'en faciliter la comprehension. Il devrait aussi pouvoir ^etre utilise comme un support d'auto-apprentissage par tout autodidacte. Notons que la presentation de l'ouvrage sera majoritairement independante de tout systeme d'exploitation. Toutefois, quelques chapitres se- ront destines principalement a des utilisateurs du systeme d'exploitation Mi- crosoft Windows. Nous pensons egalement utile de donner, par endroits, des complements pour les utilisateurs de Linux ou de Macintosh. Les chapitres du livre sont tous structures de la m^eme maniere. Chaque chapitre debute par un petit encart indiquant les pre-requis necessaires a la lecture dudit chapitre ainsi qu'un descriptif succinct du contenu du chapitre. x Le logicielRLes notions theoriques sont agrementees de nombreux exemples et egalement parsemees de pauses invitant a pratiquer directement sur l'ordinateur ce qui a ete vu. Chaque chapitre se termine enn par une partie de contr^ole de l'acqui- sition des connaissances sous la forme d'un encadre de termes a retenir, suivie d'une section d'exercices theoriques a faire sur feuille, et pouvant servir de questions a un examen sur table. Une che de travaux pratiques est egalement fournie en n de chapitre. Celle-ci permet de verier que les competences pra- tiques ont bien ete assimilees. Notez que les exercices et les travaux pratiques doivent ^etre traites uniquement avec les notions apprises dans les chapitres pre- cedents. La trame sequentielle du livre se deroule comme suit. Apres une breve intro- duction destinee a mettre le lecteur en appetit, et la presentation de quelques jeux de donnees qui seront exploites tout au long de l'ouvrage pour illustrer l'utilisation deR, la premiere partie du livre est ensuite dediee a l'apprentissage des concepts principaux du logicielR: organisation des donnees, importation et exportation, manipulations diverses, acces a la documentation, representa- tions graphiques, programmation et maintenance. Cette partie consiste donc a surR. La seconde partie du livre est consacree a l'utilisation du logicielRdans quelques contextes mathematiques et statistiques. Cette partie devrait ^etre lue apres les chapitres de la premiere partie, mais elle devrait tout de m^eme se reveler accessible aux utilisateurs possedant deja quelques notions deR. Elle contient les instructionsRnecessaires pour quelques-uns des principaux cours de statistique et de mathematiques jusqu'a la licence (couvrant par exemple le programme en IUT de statistique et informatique decisionnelle en France) : cal- cul matriciel, integration, optimisation, statistiques descriptives, simulations, intervalles de conance et tests d'hypotheses, regression lineaire simple et mul- tiple, analyse de la variance. Notons enn que chaque chapitre de statistique dans la seconde partie s'ap- puie sur un ou plusieurs jeux de donnees reelles, gracieusement mis a disposition par l'ISPED (Institut de sante publique, d'epidemiologie et de developpement de Bordeaux) et presentes en debut d'ouvrage, qui en rendent ainsi l'apprentis- sage plus concret et plus attractif. Nous en protons pour remercier particulie- rement toute l'equipe pedagogique du master de sante publique de l'ISPED. Ces donnees, ainsi que plusieurs fonctions developpees specialement pour le livre, et qui y sont presentees ou utilisees, sont disponibles dans unpackageRassocie a l'ouvrage qui s'appelleLeLogicielR. Nous remercions egalement Mohamed El Methni et Taghi Barumandzadeh pour le materiel qu'ils nous ont fourni dans la redaction du chapitre sur l'ANOVA.

Avant-propos xi

Deuxieme edition

Nous tenons a remercier Hubert Raymondaud pour nous avoir donne la motivation necessaire pour ecrire cette seconde edition, qui s'accro^t de pres de 200 pages. Plusieurs erreurs mineures ont ete corrigees, certaines notions clariees et de nombreuses astuces ou renvois vers d'autres ressources ont ete ajoutes au l du texte. La section A.4, intitulee, a ete tron- quee et une nouvelle section A.5 intituleea ete ajoutee. Dans cette derniere, nous decrivons l'utilisation de l'outilRCommander, un package permettant l'utilisation deRvia des menus, puis expliquons com- ment utiliser au mieuxRvia sa console. Dans le Chapitre 2, un nouvelle section 2.4, intitulee, a ete ajoutee. Dans le Chapitre 3, la section 3.4 a ete deplacee apres la section 3.7. Elle de- vient donc la nouvelle section 3.7. Une nouvelle section 3.8, intitulee, a ete ajoutee apres cette section suivie d'une nouvelle section 3.9, intitulee, expliquant les problemes numeriques pouvant survenir du fait des limites de representation des nombres sur un ordinateur. De plus, un TP sur la creation de fonctions (le F-) a ete ajoute a la toute n du TP du Chapitre 3. Dans le Chapitre 6, une nouvelle section 6.5, intitulee, fait son apparition juste avant l'ancienne section 6.5qui s'intitule desormaiset porte le numero 6.6. Le contenu de toute cette section a ete modie et largement augmente. L'ancienne sous-section 6.5.1 de la version 1 devient la sous-section 6.6.1. Nous avons aussi rajoute une section 6.7 intitulee. Le titre du Chapitre 10 a ete change enpour ^etre plus representatif de son contenu. Pour nir, la correction de tous les exercices et de tous les TPs a ete integree dans l'ouvrage, ce qui en fait tres probablement le manuel le plus complet a ce jour sur le logicielR. Celui-ci pourra ^etre utilise pour former les lyceens francais dans le cadre du nouveau programme national, ainsi que les etudiants des classes preparatoires et de l'universite. Il permet toujours de mener ses lecteurs a un stade avance de ma^trise du logiciel. xii Le logicielRParcours dierencies Nous avons mentionne explicitement, a l'aide du symboley, les sections plus delicates ou moins fondamentales pouvant ^etre ecartees lors d'une premiere lec- ture de l'ouvrage, sans pour autant nuire a la comprehension et a la ma^trise du logicielR. Notez que ce livre a d'abord ete pense pour ^etre lu par des etudiants is- sus de formations mathematiques ou statistiques. Toutefois, nous proposons ci-dessous, pour les etudiants ou les chercheurs ayant suivi un parcours plus , d'adopter un parcours dierencie pour le cur de l'ouvrage. La lecture des sections delicates sera egalement omise.

PARTIE I : LES BASES DU LOGICIEL

a) Les con ceptsd eb ase,l' organisationd esdon nees( chapitre1) . b) I mportation-exportatione tpr oductiond ed onnees( chapitre2) . c)

M anipulationde don nees( chapitre3) .

d)Ret sa documentation (chapitre 4). e) T echniquesp ourt racerde scou rbese td esgr aphiques( chapitre5) . f)

Mai ntenanced ess essions( chapitre7) .

PARTIE II : STATISTIQUES

ELEMENTAIRES

a) V ariablesal eatoires,l oiset s imulations( chapitre10) . b)

S tatistiquede scriptive(c hapitre9) .

c) In tervallesd ec onancee tt estsd' hypotheses( chapitre11). d) R egressionl ineairesi mplee tm ultiple( chapitre12) . e)

An alysed ev ariance elementaire( chapitre13) .

PARTIE III : CONCEPTS AVANC

ES a) M athematiquesde b ase: cal culmat riciel,in tegration,opt imisation (chapitre 8). b)

P rogrammatione nR(chapitre 6).

Avant-propos xiii

Mises en relief

Nous avons souhaite soigner le mode de presentation de l'ouvrage (la forme) pour que l'information (le contenu) soit digeste. Par consequent, des encadres qui permettent la mise en relief de certaines informations importantes an de fa- ciliter la comprehension des notions abordees sont disposes a plusieurs endroits strategiques du livre. Ces encadres se distinguent par des ic^ones apparaissant dans la marge.Astuce Information supplementaire relative au sujet traite.

Attention

Souligne un point important a ne pas negliger.

Remarque

Propose conseils et trucs pratiques.

Renvoi

Fait reference a un autre chapitre ou a un site internet.

Expert

Elements avances dont la lecture peut ^etre omise en premier lieu.Linux

Information reservee aux utilisateurs Linux.

Mac

Information reservee aux utilisateurs Macintosh.

xiv Le logicielRSolutions des exercices et des travaux pratiques Les corriges des exercices et des seances de travaux pratiques sont fournis sur le site internet associe au livre (http://www.biostatisticien.eu/springeR). Par ailleurs, quelques projets plus ambitieux que les travaux pratiques se- ront rendus accessibles sur ce site.

Conventions de police

La l ettreRdesigne le logicielR.

Nou sut iliseronsl 'ecritureitaliquepour designer des termes empruntes a la langue anglaise commedata.frameoupackageou bien des termes latins commeversusoua priori. Nou su tiliseronsu nep oliced ecar acteres achasse fixe(environnement

Verbatim) pour noter des instructionsR.

Nou su tiliseronsu nep oliced ecar acterese nPetites capitalespour designer un jeu de donnees et une police avec descaracteres sans em- pattementpour designer le nom du chier physique contenant ce jeu de donnees. Cette derniere police de caracteres sera utilisee pour indiquer n'importe quel chier ou dossier mentionne dans cet ouvrage.

Sommaire

Avant-proposix

Liste des figuresxxix

Liste des tableauxxxxiii

Notations math

´ematiquesxxxv

A Pr

´esentation du logicielR1

A.1 Presentation du logiciel

. . . . . . . . . . . . . . . . . . . . 1

A.1.1 Origines

. . . . . . . . . . . . . . . . . . . . . . . . . 1 A.1.2 Pourquoi utiliserR?. . . . . . . . . . . . . . . . . . 1 A.2Ret les statistiques. . . . . . . . . . . . . . . . . . . . . . 3 A.3Ret les graphiques. . . . . . . . . . . . . . . . . . . . . . . 4 A.4 L'interface graphique deR(GUI). . . . . . . . . . . . . . . 5 A.5 Mes premiers pas enR. . . . . . . . . . . . . . . . . . . . . 6 A.5.1 Utilisation deRCommander. . . . . . . . . . . . . . 6

A.5.1.1 Lancement deRCommander. . . . . . . . . 6

A.5.1.2 Manipulation de donnees avecRCommander8

A.5.1.3 Quelques manipulations statistiques avecRCom- mander. . . . . . . . . . . . . . . . . . . . . 13 A.5.1.4 Rajouter des fonctionnalites a l'interface de

RCommander. . . . . . . . . . . . . . . . . . 19

A.5.2 UtiliserRvia la console. . . . . . . . . . . . . . . . 20 A.5.2.1 La force deRillustree sur un exemple. . . 21

A.5.2.2 Un survol de la syntaxe deRvia des com-

mandes a taper . . . . . . . . . . . . . . . . . 25

B Quelques jeux de donn

´ees et probl´ematiques31

B.1 Indice de masse corporelle (IMC) chez des enfants . . . . . 31

B.2 Poids de naissance

. . . . . . . . . . . . . . . . . . . . . . . 32 B.3 Epaisseur de l'intima-media. . . . . . . . . . . . . . . . . . 33

B.4 Alimentation chez des personnes ^agees

. . . . . . . . . . . . 34 xvi Le logicielRB.5 Etude cas temoins sur l'infarctus du myocarde. . . . . . . 35 B.6 Tableau resumant l'utilisation des jeux de donnees . . . . . 36

I Les bases du logiciel R

3 7

1 Les concepts de base, l"organisation des donn

´ees39

1.1 Votre premiere session

. . . . . . . . . . . . . . . . . . . . . 39

1.1.1Rest une calculatrice. . . . . . . . . . . . . . . . . 40

1.1.2 Achage des resultats et redirection dans des variables

41

1.1.3 Strategie de travail

. . . . . . . . . . . . . . . . . . 43

1.1.4 Utilisation de fonctions

. . . . . . . . . . . . . . . . 47

1.2 Les donnees dansR. . . . . . . . . . . . . . . . . . . . . . 50

1.2.1 Nature (ou type, ou mode) des donnees

. . . . . . . 50

1.2.1.1 Type numerique (numeric). . . . . . . . . 50

1.2.1.2yType complexe (complex). . . . . . . . . 51

1.2.1.3 Type booleen ou logique (logical). . . . 52

1.2.1.4 Donnees manquantes (NA). . . . . . . . . 52

1.2.1.5 Type cha^nes de caracteres (character). 53

1.2.1.6yDonnees brutes (raw). . . . . . . . . . . . 54

Recapitulatif

. . . . . . . . . . . . . . . . . . . . . . . . . . . 54

1.2.2 Structures de donnees

. . . . . . . . . . . . . . . . . 55

1.2.2.1 Les vecteurs (vector). . . . . . . . . . . . 55

1.2.2.2 Les matrices (matrix), les tableaux (arrays)56

1.2.2.3 Les listes (list). . . . . . . . . . . . . . . 58

1.2.2.4 Le tableau individusvariables (data.frame)59

1.2.2.5 Les facteurs (factor) et les variables ordi-

nales (ordered). . . . . . . . . . . . . . . . 60

1.2.2.6 Les dates

. . . . . . . . . . . . . . . . . . . 62

1.2.2.7 Les series temporelles

. . . . . . . . . . . . 62

Recapitulatif

. . . . . . . . . . . . . . . . . . . . . . . . . . . 63

Termes a retenir

. . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

Exercices

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

Fiche de TP

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

2 Importation-exportation et production de donn

´ees67

2.1 Importer des donnees

. . . . . . . . . . . . . . . . . . . . . 67

2.1.1 Importer des donnees depuis un chier texte ASCII

67

2.1.1.1 Lecture de donnees avecread.table(). . 68

2.1.1.2 Lecture de donnees avecread.ftable(). 71

2.1.1.3 Lecture de donnees avec la fonctionscan()72

2.1.2 Importer des donnees depuis Excel ou le tableur d'Open-

Oce . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

2.1.2.1 Utiliser le copier-coller

. . . . . . . . . . . 73

Sommaire xvii

2.1.2.2 Passer par un chier ASCII intermediaire

. 74

2.1.2.3 Utiliser despackagesspecialises. . . . . . 74

2.1.3 Importer des donnees depuis SPSS, Minitab, SAS ou

Matlab

. . . . . . . . . . . . . . . . . . . . . . . . . . 75

2.1.4 Les gros chiers de donnees

. . . . . . . . . . . . . . 75

2.2 Exporter des donnees

. . . . . . . . . . . . . . . . . . . . . 77

2.2.1 Exporter des donnees vers un chier texte ASCII

. . 77

2.2.2 Exporter des donnees vers Excel ou OpenOce Calc

77

2.3 Creation de donnees

. . . . . . . . . . . . . . . . . . . . . . 77

2.3.1 Entrer des donnees jouets

. . . . . . . . . . . . . . . 77

2.3.2 Generer des donnees pseudo-aleatoires

. . . . . . . . 79

2.3.3 Entrer des donnees issues d'un support papier

. . . 79

2.4yLecture/ecriture dans les bases de donnees. . . . . . . . . 81

2.4.1 Creer une base de donnees et une table

. . . . . . . 81

2.4.2 Creer une source de donnees compatible avec MySQL

82

2.4.3Ecrire dans une table. . . . . . . . . . . . . . . . . 83

2.4.4 Lire dans une table

. . . . . . . . . . . . . . . . . . 84

Termes a retenir

. . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

Exercices

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85

Fiche de TP

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

3 Manipulation de donn

´ees, fonctions91

3.1 Operations sur les vecteurs, matrices et listes

. . . . . . . . 91

3.1.1 Arithmetique vectorielle

. . . . . . . . . . . . . . . . 91

3.1.2 Le recyclage

. . . . . . . . . . . . . . . . . . . . . . 92

3.1.3 Fonctions basiques

. . . . . . . . . . . . . . . . . . . 93

3.1.4 Operations sur les matrices ou lesdata.frames. . . 94

3.1.4.1 Informations sur l'architecture

. . . . . . . 94

3.1.4.2 Fusion de tables

. . . . . . . . . . . . . . . 95

3.1.4.3 La fonctionapply(). . . . . . . . . . . . 99

3.1.4.4 La fonctionsweep(). . . . . . . . . . . . 100

3.1.4.5 La fonctionstack(). . . . . . . . . . . . 100

3.1.4.6 La fonctionaggregate(). . . . . . . . . . 101

3.1.4.7 La fonctiontransform(). . . . . . . . . . 102

3.1.5 Operations sur les listes

quotesdbs_dbs27.pdfusesText_33
[PDF] BLOOM PUBLIC SCHOOL Vasant Kunj ,New Delhi Lesson Plan

[PDF] Bloomberg Terminal Guide

[PDF] Bloomberg/BRVM Investment Days Projet de programme - Gestion De Projet

[PDF] Bloomdido - Charlie Parker

[PDF] Bloomfield Stock Exchange Review S20 - Fabrication

[PDF] Bloom´s - Blumen- und Gartenkunst

[PDF] Bloque disque avec alarme Lock Alarm 3110 DESCRIPTION

[PDF] Bloqué par un proxy ou un parefeu sur votre lieu de travail ou

[PDF] BLOQUE-DISQUE ALARME Toutes cylindrées - Anciens Et Réunions

[PDF] Bloque-Parking - SOMMER Antriebs

[PDF] Bloquer le nerf vague pour traiter l`obésité : traitement - Diabète

[PDF] Bloquer les chevaux de Troie de type porte dérobée - Antivirus Et Les Logiciels Malveillants

[PDF] Bloquer les pubs avec Chrome - Email

[PDF] Bloqueurs de fenêtres - Anciens Et Réunions

[PDF] Bloquez les intrus qui se bousculent au portillon! - Anciens Et Réunions