[PDF] Manipulation de données avec R par Odile Wolber





Previous PDF Next PDF



Manipulation de données avec R par Odile Wolber

peut également créer un tableau de données avec la fonction data.frame. On accède à la valeur de la ième ligne et jème colonne par x[ij].



Fonctions TI-83 Premium CE

Touches et pour passer d'une ligne à l'autre. Puis touche graphe. Régler les paramètres du tableau de valeurs. Rubrique déf table (touches 2nd fenêtre ).



Fonctions Représentation graphique de fonctions Tableau de

Tracer la courbe représentative de la fonction Éditer le tableau de valeurs de cette fonction. ... pour passer d'une ligne à l'autre. Puis touche GRAPH.



AIDE MÉMOIRE R Référence des fonctions de R les plus courantes

data.frame ne renvoie que des lignes uniques) table(x) renvoie une table avec le décompte de chaque valeur différente de x; table(x



Fonctions Représentation graphique Tableau de valeurs CASIO

Tracer la courbe représentative de la fonction Editer le tableau de valeurs de cette fonction. ? Définir une fonction ... pour changer de ligne.



Utiliser sa calculatrice Graph 25+ Pro au lycée

TABLE : Pour stocker des fonctions créer un tableau de valeurs et tracer les Pour sélectionner un fichier



IBM SPSS Statistics 26 - Guide abrégé

Affichage de libellés de variable et de valeur . . 50 modifier les données et redimensionner le tableau en fonction de vos besoins.



Représentation graphique Tableau de valeurs

Tracer la courbe représentative de la fonction Editer le tableau de valeurs de cette fonction. ? Définir une fonction ... pour changer de ligne.



Fonctions TI-82 Stats.fr

Touches et pour passer d'une ligne à l'autre. Puis touche graphe. Régler les paramètres du tableau de valeurs. Instruction déf table (touches 2nde fenêtre).



RÉSOLUTION DÉQUATIONS À LAIDE DEXCEL

Observez que B1 joue le rôle de dans la formule. En insérant des valeurs dans la cellule B1 vous constaterez que le résultat de la fonction changera. Or

1

Manipulation de données avec R

par

Odile Wolber

1. Les objets

R manipule des objets. Ainsi, lorsque l'on importe un fichier dans R, on obtient dans R un objet nommé data frame. Les variables, les données, les fonctions, les résultats d'analyses sont stockés dans des objets. Il existe plusieurs types d'objets : vecteurs, facteurs, etc. Les principaux objets sont présentés dans cette partie.

Les objets sont caractérisés par leur nom, leur contenu et des attributs qui vont spécifier le

type de données représenté par l'objet. Le nom d'un objet doit commencer par une lettre et peut comporter des lettres, des chiffres, des points (.) et des espaces soulignés (_). R distingue, pour les noms des objets, les majuscules des minuscules, c'est-à-dire que x et X nommeront des objets distincts. Les objets ont tous au moins deux attributs : le mode et la longueur. Le mode est le type

des éléments d'un objet. Il en existe quatre principaux : numérique, caractère, complexe,

et logique (FALSE ou TRUE). Pour connaître le mode est la longueur d'un objet, on utilise respectivement les fonctions mode() et length().

1.1. Objets basiques

L'objet le plus basique est une constante, qui peut être numérique, complexe, caractère, ou logique. On affecte directement une valeur à un objet. L'objet n'a pas besoin d'être déclaré.

Par exemple, on saisit sur la console :

n = 8. On tape ensuite n pour afficher sa valeur. On obtient le résultat suivant : [1] 8 Le symbole [1] indique que l'affichage commence au premier élément de n. On aurait également pu affecter une valeur à l'objet n en utilisant le signe <- (signe moins accolé à un crochet) ou -> : n <- 8 n [1] 8

8 -> n

n [1] 8 Dans la suite du document, on utilisera le symbole "=».

Quelques exemples d'objets basiques :

x = 1 x [1] 1 Si on affecte une valeur à un objet existant, sa valeur précédente est effacée : x = 10 x [1] 10 2 y = 10 + 2 y [1] 12 On utilise ";» pour séparer des commandes distinctes sur la même ligne : w = 8; name = "Wikistat"; dicton = "Aide-toi, le ciel t'aidera"; w ; name ; dicton [1] 8 [1] "Wikistat" [1] "Aide-toi, le ciel t'aidera"

1.2. Autres objets

1.1.1. Les objets et leurs attributs

On crée des objets en utilisant l'opérateur = ou -> ou <-. Le mode et le type de

l'objet ainsi créé sont généralement déterminés de façon implicite. Il est possible

de créer un objet en précisant son mode, sa longueur, son type, etc. On peut, par exemple, créer un vecteur 'vide' puis modifier successivement ses éléments, ce qui est beaucoup plus efficace que de rassembler ces éléments avec c(). On utilisera alors l'indexation. On peut aussi créer des objets à partir d'autres objets. Le tableau suivant indique les modes possibles pour les objets vecteur, facteur, array, matrice, data.frame, ts et liste (tableau tiré du document R pour les débutants d'Emmanuel Paradis).

Objet Modes

Plusieurs modes

possibles dans le même objet vecteur num, car, comp, log Non facteur num, car Non array num, car, comp, log Non matrice num, car, comp, log Non data.frame num, car, comp, log Oui ts num, car, comp, log Oui liste num, car, comp, log, fonction, expression Oui num = numérique, car = caractère, comp = complexe, log = logique Nous n'aborderons pas les array (tableaux à k dimensions, la matrice au cas particulier où k=2), ni les ts (données de type séries temporelles). Les valeurs manquantes sont représentées par NA (Not Avalaible) quel que soit l'objet ou le mode.

1.1.2. Vecteurs

La fonction vector() a deux arguments : le mode des éléments qui compose le vecteur et la longueur du vecteur. a = vector("numeric", 5) b = vector("character", 5) c = vector("logical", 5) d = vector("complex", 5) équivalent à a = numeric(5) b = character(5) c = logical(5) d = complex(5) Si on tape sur la console a;b;c;d, le résultat suivant s'affiche : [1] 0 0 0 0 0 [1] "" "" "" "" "" [1] FALSE FALSE FALSE FALSE FALSE [1] 0+0i 0+0i 0+0i 0+0i 0+0i 3 On peut également construire un vecteur à l'aide de la fonction c() vecteur = c(5, 7.2, 3.6, 4.9); vecteur [1] 5.0 7.2 3.6 4.9

1.1.3. Facteurs

La fonction factor() crée des variables qualitatives nominales. factor( x, levels = sort(unique(x), na.last = TRUE), labels = levels, exclude = NA, ordered = is.ordered(x)) levels spécifie quels sont les niveaux possibles du facteur (par défaut les valeurs uniques du vecteur x), i.e. les valeurs que peuvent prendre les

éléments du facteur.

labels définit les noms des niveaux exclude les valeurs de x à ne pas inclure dans les niveaux ordered argument logique spécifiant si les niveaux du facteur sont ordonnés. factor(1:3) [1] 1 2 3

Levels: 1 2 3

factor(1:3, levels = 1:5) [1] 1 2 3

Levels: 1 2 3 4 5

factor(1:3, levels = 1:5, labels = c("A", "B", "C", "D", "E")) [1] A B C

Levels: A B C D E

factor(c(5,7,8,9), levels=5 :8) [1] 5 7 8

Levels : 5 6 7 8

9 ne fait pas partie des levels (ensemble de définition). Le chiffre 9 est donc codé

comme valeur manquante. Exemple : 10 personnes ont répondu à une enquête de satisfaction auto- administrée. Le degré de satisfaction est recueilli à partir d'une variable comportant les 4 modalités suivantes :

1 - très satisfait

2 - satisfait

3 - insatisfait

4 - pas du tout satisfait

Voici les réponses des répondants : 1 1 2 3 1 0 4 2 3 4 Définissez un facteur dans R pour coder ces réponses. [1] 1 1 2 3 1 4 2 3 4

Levels: 1 2 3 4

La réponse 0 ne fait pas partie du domaine de définition. Aussi, elle est codée comme valeur manquante .

1.1.4. Matrices

Une matrice est un vecteur qui possède un argument supplémentaire qui définit les dimensions de la matrice. Tous les éléments d'une matrice doivent être de même mode. matrix( data = NA, nrow = 1, ncol = 1, byrow = FALSE, dimnames = NULL) 4 byrow indique si les valeurs données par data doivent remplir successivement les colonnes (FALSE, par défaut) ou les lignes (si

TRUE).

dimnames permet de donner des noms aux lignes et colonnes. On peut aussi donner des noms aux colonnes ou aux lignes de la matrice grâce aux fonctions rownames() et colnames(). matrix(0, 5, 7) [,1] [,2] [,3] [,4] [,5] [,6] [,7] [1,]0 0 00000 [2,]0 0 00000 [3,]0 0 00000 [4,]0 0 00000 [5,]0 0 00000 x = 1:20 > x [1] 1 2 3 4 5 6 7 8 9 10 11 12 [13] 13 14 15 16 17 18 19 20 mat1 = matrix(x, 4, 5) > mat1 [,1] [,2] [,3] [,4] [,5] [1,] 1 5 9 13 17 [2,] 2 6 10 14 18 [3,] 3 7 11 15 19 [4,] 4 8 12 16 20 mat2 = matrix(x, 4, 5, byrow = TRUE) > mat2 [,1] [,2] [,3] [,4] [,5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4,] 16 17 18 19 20 La fonction paste() est utile dans une situation où on souhaite nommer les lignes et / ou les colonnes d'une matrice. En effet, la fonction paste() permet de concaténer des objets. nom_var = paste("V", 1:5, sep = "") > nom_var [1] "V1" "V2" "V3" "V4" "V5" nom_ind = paste("I", 1:4, sep = "") > nom_ind [1] "I1" "I2" "I3" "I4" colnames(mat2) = nom_var rownames(mat2) = nom_ind (ou bien dimnames(mat2) = list(nom_ind, nom_var)) mat2 > mat2

V1 V2 V3 V4 V5

I1 1 2 3 4 5

I2 6 7 8 9 10

I3 11 12 13 14 15

I4 16 17 18 19 20

5

1.1.5. Data frames

Un tableau de données est créé de façon implicite par la fonction read.table. On peut également créer un tableau de données avec la fonction data.frame. Les éléments d'une data.frame ne doivent pas nécessairement avoir le même mode. Les éléments de mode caractères sont considérés comme des facteurs. Tous les éléments de la data.frame doivent être de la même longueur. Dans le cas contraire, l'élément le plus court est " recyclé » un nombre entier de fois. Pour créer une data.frame à partir d'un vecteur numérique et d'un vecteur caractère, on procède de la manière suivante : a = c(1, 2, 3) ; a ; mode(a); [1] 1 2 3 [1] "numeric" b = c("a", "b", "c") ; b ; mode(b) [1] "a" "b" "c" [1] "character" df = data.frame(a, b) > df a b 1 1 a 2 2 b 3 3 c Pour créer avec une seule instruction une data.frame avec une variable numérique et une variable caractère : df2 = data.frame(a = 1:6, b = letters[1:6]); > df2 a b 1 1 a 2 2 b 3 3 c 4 4 d 5 5 e

6 6 f

Si on juxtapose un vecteur de longueur 6 et un vecteur de longueur 3, le deuxième vecteur est dupliqué : a = c(1, 2, 3, 4, 5, 6) b = c("a", "b", "c") df = data.frame(a, b) >df a b 1 1 a 2 2 b 3 3 c 4 4 d 5 5 e

6 6 f

Il faut donc que la longueur de l'un des vecteurs soit un multiple de la longueur de l'autre vecteur : a = c(1, 2, 3, 4, 5) b = c("a", "b", "c") df = data.frame(a, b) Error in data.frame(a, b) : arguments imply differing number of rows: 5, 3 6

1.1.6. Listes

Une liste se crée de la même manière qu'une data.frame. Tout comme les data.frame, les éléments qui la compose ne sont pas nécessairement du même mode. Ils ne sont pas nécessairement de la même longueur, ainsi que l'illustre l'exemple suivant : a = c(1, 2, 3, 4, 5) b = c("a", "b", "c") liste1 = list(a, b) > liste1 [[1]] [1] 1 2 3 4 5 [[2]] [1] "a" "b" "c" On peut nommer les éléments d'une liste de la manière suivante : names(liste1) = c("L1", "L2") ;liste1 $L1 [1] 1 2 3 4 5 $L2 [1] "a" "b" "c" liste2 = list(L1 = a, L2 = b) liste2 $L1 [1] 1 2 3 4 5 $L2 [1] "a" "b" "c"

2. Conversions

2.1. Conversion de modes

Dans de nombreuses situations pratiques, il est utile de convertir le mode d'un objet en un autre. Une telle conversion sera possible grâce à une fonction de la forme : as.mode (as.numeric, as.logical, as.character, ...). conversion en fonction règles numérique as.numeric FALSE ĺ 0

TRUE ĺ 1

"1", "2", ... ĺ 1, 2,... "A", ...ĺ NA logique as.logical 0 ĺ FALSE autres nombres ĺ TRUE "FALSE" ĺ FALSE "TRUE" ĺ TRUE autres caractères ĺ NA caractère as.character 1, 2, ... ĺ "1", "2", ...

FALSE ĺ "FALSE"

TRUE ĺ "TRUE"

(tableau tiré du document R pour les débutants d'Emmanuel Paradis) 7

Considérons quelques exemples simples :

Premier cas : On souhaite convertir des objets de mode logical en mode numeric logique = c(FALSE, FALSE, TRUE, TRUE, FALSE, TRUE) conversion_numerique = as.numeric(logique) conversion_numerique [1] 0 0 1 1 0 1 Deuxième cas : On souhaite convertir des objets de mode character en mode numeric caractere = c("1", "2", "3", "A", "/", "T", "%", "-") conversion_numerique = as.numeric(caractere)

Warning message:

NAs introduced by coercion

conversion_numerique [1] 1 2 3 NA NA NA NA NA Troisième cas : On souhaite convertir des objets de mode numeric en mode logical numerique = 0:5 conversion_logique1 = as.logical(numerique) conversion_logique1 [1] FALSE TRUE TRUE TRUE TRUE TRUE Quatrième cas : On souhaite convertir des objets de mode character en mode logical caractere = c("FALSE", "TRUE", "F", "T", "false", "t", "A", "(") conversion_logique2 = as.logical(caractere) conversion_logique2 [1] FALSE TRUE FALSE TRUE FALSE NA NA NA Cinquième cas : On souhaite convertir des objets de mode numeric en mode character numerique = 1:8 conversion_caractere1 = as.character(numerique) conversion_caractere1 [1] "1" "2" "3" "4" "5" "6" "7" "8" Sixième cas : On souhaite convertir des objets de mode logical en mode character logique = c(TRUE, FALSE) conversion_caractere2 = as.character(logique) conversion_caractere2 [1] "TRUE" "FALSE"

2.2. Conversion d'objets

Dans de nombreuses situations pratiques, il est utile de convertir un objet en un autre. Une telle conversion sera possible grâce à une fonction de la forme : as.objet (as.matrix, as.data.frame, as.list, as.factor, ...). On souhaite convertir la matrice a en une data.frame b : > a = matrix(1:25, nrow = 5, ncol = 5);a; [,1] [,2] [,3] [,4] [,5] [1,] 1 6 11 16 21 [2,] 2 7 12 17 22 [3,] 3 8 13 18 23 [4,] 4 9 14 19 24 [5,] 5 10 15 20 25 8 b = as.data.frame(a);b;

V1 V2 V3 V4 V5

1 1 6 11 16 21

2 2 7 12 17 22

3 3 8 13 18 23

4 4 9 14 19 24

5 5 10 15 20 25

La conversion d'un facteur en numérique se fait en deux étapes. En effet, R convertit avec le codage numérique des niveaux du facteur.

Exemples :

facteur = factor(c(1, 5, 10));facteur [1] 1 5 10

Levels: 1 5 10

facteur_numerique1 = as.numeric(facteur);facteur_numerique1; [1] 1 2 3 Sur l'exemple suivant, le facteur comporte les modalités Male (level 2) et Female (level 1). La conversion en numérique donne donc le facteur 2 1. fac2 = factor(c("Male", "Female")) fac2 [1] Male Female

Levels: Female Male

as.numeric(fac2) [1] 2 1 Pour conserver un facteur (en numérique) en conservant les niveaux tels qu'ils sont spécifiés, on convertira d'abord en caractère puis en numérique. facteur_caractere = as.character(facteur);facteur_caractere [1] "1" "5" "10" facteur_numerique = as.numeric(facteur_caractere);facteur_numerique [1] 1 5 10

3. Accéder aux données

3.1. Lister les objets en mémoire

Supposons qu'on ait les objets suivants en mémoire : x = 10 ; X = 5 w = 8 name = "Wikistat" dicton = "Aide-toi, le ciel t'aidera" y = 10 + 2 La fonction ls() permet d'afficher la liste des objets en mémoire (seul le nom des objets est affiché) : ls() [1] "X" "dicton" "name" "w" "x" "y" Si on souhaite lister uniquement les objets contenant un caractère donné dans leur nom, on utilisera l'option pat (abréviation de pattern) : ls(pat = "n") [1] "dicton" "name" 9 Pour restreindre la liste aux objets qui commence par un caractère donné on utilisera l'option " ^ » : ls(pat = "^n")quotesdbs_dbs19.pdfusesText_25
[PDF] tableau de valeur maths

[PDF] tableau de valeur ti 83 premium

[PDF] Tableau de valeurs

[PDF] Tableau de valeurs de la fonction

[PDF] Tableau de valeurs et représentation graphique d'une fonction

[PDF] tableau de variation calculatrice ti-82

[PDF] tableau de variation complet d'une fonction

[PDF] Tableau de variation d'une fonction f

[PDF] Tableau de variation d'une fonction, besoin d'aide!

[PDF] Tableau de variation d'une valeur absolue

[PDF] tableau de variation d'un quotient

[PDF] tableau de variation dune fonction affine

[PDF] tableau de variation dune fonction du second degré

[PDF] tableau de variation d'une fonction exercice corrigé

[PDF] tableau de variation dune fonction exponentielle