[PDF] TP1 : Introduction au logiciel R





Previous PDF Next PDF



Statistiques

On est amené à calculer les effectifs cumulés croissants de la série étudiée. Exemple : Notes xi. 10. 12. 13. 18. Nombre d'élèves 



STATISTIQUES Médiane quartiles et déciles; Diagrammes en boîtes

la moyenne entre la nième et la (n+1)ème valeur. Exemple. Prenons les valeurs (notes à un DS vitesses de vents



MESURER ET REPRÉSENTER LES INÉGALITÉS

3) Les écarts interquantiles. Exemples avec les déciles => écarts interdéciles. Pour résumer la dispersion d'une série on peut calculer : 



DÉCLARATION DES PRIX DE VENTE DES PRODUITS FINANCÉS

Méthode de calcul : Pour calculer les déciles de prix sur votre fichier source vous pouvez vous aider de deux méthodes : - La première (exemple 1) 





SAVOIR-FAIRE Les quantiles Activités pour lélève

Exemple avec le revenu : Le 1er décile représente le revenu en dessous duquel sont rémunérés les 10 % de la population les plus pauvres. Le 9ème décile est le 



Exercices de statistiques sur tableur Excel

Obtenir les extremums la médiane



VARIABLES QUANTITATIVES CONTINUES

Calcul du premier décile La proportion cumulée de 10 % correspond à la classe ]a;b] = ]5 ; 10] donc le premier décile est donné par la formule.



BAREME pour laffectation des stagiaires

Pour déterminer votre décile faites le calcul suivant : votre décile. Par exemple



Quantiles et simulation (resp. centiles).

Par exemple un quantile de niveau 0 8 est appelé huitième décile et un la fonction de répartition



[PDF] Statistiques - Meilleur En Maths

Exemple : Les densités de population en habitants par km² de 25 pays de l'union européenne (source wikipédia 2007) (Remarque : actuellement il y a 27 



[PDF] STATISTIQUES Médiane quartiles et déciles; Diagrammes en boîtes

Les déciles permettent de séparer une série statistique en dix groupes de même effectif (à une unité près) Un dixième des valeurs sont inférieures au premier 



[PDF] SAVOIR-FAIRE Les quantiles Activités pour lélève

Exemple avec le revenu : Le 1er décile représente le revenu en dessous duquel sont rémunérés les 10 de la population les plus pauvres Le 9ème décile est le 



Quartile et décile Statistiques Cours seconde - Mathsbook

Je vous donne dans ce cours les définition des quartile et décile A travers de nombreux exemple d'application je vous explique comment les calculer et les 



[PDF] TD 5 : Statistiques descriptives : Paramètres de position

Calculer la médiane les quartiles le premier décile et le dernier décile à moustaches (par exemple la fréquence cumulée correspondant à 60 ans et de 



[PDF] STATISTIQUES - maths et tiques

Exemple : Pour la série étudiée dans le chapitre Pour la série étudiée dans le chapitre calculer la médiane L'effectif total est égal à 66



[PDF] Détermination de la médiane des quartiles ou déciles par

Pour la médiane par exemple : • Déterminer la moitié de l'effectif total • Calculer les effectifs cumulés croissants • Identifier la classe `a laquelle 



[PDF] Statistiques descriptives: Résumés et exercices - HAL Paris 8

12 jan 2017 · i) Calculer l'intervalle de classe en note z Comme précédemment avec les quartiles et les déciles le nombre de coupures nécessaires est égal 



[PDF] Statistique 31411 Module 6 – Les mesures de position - Pages

Calcul des déciles On désire parfois utiliser obtenir une mesure normalisées basées sur les déciles On calcule le rang décile d'une valeur par la formule 

  • Comment calculer le décile ?

    Calcul des déciles
    Le décile est calculé en tant que 10-quantile : le seuil du 1er décile sépare le jeu de données entre les 10 % inférieurs et le reste des données. le seuil du 9e décile sépare les 90 % inférieurs des données des 10 % supérieurs.
  • Comment calculer D1 ?

    Le premier décile (D1) des salaires correspond, par exemple, au niveau de salaire pour lequel 10% de la population touche moins (et donc 90% touche plus) ; le neuvième décile (D9) est égal au montant pour lequel 90% touche moins (et donc 10% touche plus).
  • Comment trouver le Q1 et Q3 ?

    Vous devez séparer la moitié inférieure à la médiane en 2. Le quartile inférieur sera donc la valeur du point de rang (5 +1) ? = 3, ce qui donne Q1=15. La moitié supérieure à la médiane est également séparée en 2. Le quartile supérieur sera la valeur du point de rang 6 + 3 =9, ce qui donne Q3 = 43.
  • Le cinquième décile est le revenu le plus élevé des 50 % les moins riches : c'est aussi celui qui sépare en deux la population, appelé revenu « médian ». Parfois, on calcule le niveau de vie moyen d'une tranche de 10 % (abusivement appelée alors « décile »).
TP1 : Introduction au logiciel R Université Paul SabatierL3 SID Statistique exploratoire

TP1 : Introduction au logiciel R

Dans cette première séance de travaux pratiques, nous introduisons le logiciel libre R que nous

utiliserons dans les séances suivantes. En particulier, nous illustrons certains aspects de R en nous

basant sur les notions de statistique vues en cours.

1 Mise en place

Il est possible d"utiliser R en mode interactif grâce à la commandeR(ouR --vanillapour

éviter de charger et de sauver une session). Une fois cette commande validée, vous avez la possibilité

d"entrer des commandes directement dans l"invite de commande de R (symbole>). Le logiciel R propose de nombreuses fonctions de base. Pour quitter le mode interactif, il faut

utiliserq(). Les fonctionshelpethelp.searchpermettent d"obtenir de l"aide,help(q) # Affiche l"aide sur la fonction q

?q # Comme help(q) help.search("quit") # Cherche le mot quit dans l"aide ??quit # Comme help.search("quit")

q() # Quitte le mode interactifQue se passe-t-il si vous oubliez les parenthèses dans la dernière ligne?

Lisez l"aide de la fonctionmean.

Le mode interactif est utile pour consulter l"aide et faire des essais mais il est moins adapté

pour une utilisation avancée de R. Pour cela, nous utilisons un fichier (extension ".r" pour profiter

de la coloration syntaxique) dans lequel nous entrons les commandes que R devra exécuter. Pour

cela, un simple copier-coller des lignes de code dans le mode interactif suffit ou vous pouvez charger

un fichier avec la commandesource,source("mon_fichier.r") Dans ce fichier, vous pouvez ajouter des commentaires avec le caractère#. Tout ce qui est entre

ce caractère et le prochain retour à la ligne n"est pas interprété par R (voir le premier exemple). Les

commentaires sont particulièrement utiles lorsque nous reprenons un ancien fichier, par exemple. Bien entendu, il existe de nombreuses autres façons d"exécuter un code R. Vous pouvez créer un script exécutable, utiliser une interface graphique comme Rcmdr, ... Voir sur internet si vous souhaitez plus de renseignements sur tout cela.

2 Des données

Pour charger un jeu de données, il faut utiliser une fonction adaptée selon le type de fichier qui contient ce jeu. Une telle fonction très commune estread.tablequi permet de lire un fichier formaté en tableau et retourne une liste des valeurs. Comme tous les objets de R, cette liste 1

peut être stockée dans une variable grâce à l"opérateur d"affectation<-(il est possible d"utiliser

également l"opérateur=mais cela est déconseillé pour éviter la confusion avec l"opérateur d"égalité

Pour cette séance, nous allons utiliser deux jeux de données extraits de l"articleModeling wine

preferences by data mining from physicochemical propertiesde Cortezet al.paru dansDecision Support Systemsen 2009. Ces jeux de données contiennent différentes mesures chimiques sur plusieurs vins rouges et blanc.rouge <- read.table( header=TRUE,sep=";") blanc <- read.table(

header=TRUE,sep=";")Avec l"aide sur la fonctionread.table, expliquez à quoi servent les deux optionsheaderet

sepque nous avons utilisées. Que fait la fonctiontypeof? Que vous retourne-t-elle pour les listesrougeetblanc? Que fait la fonctionnames? Que vous retourne-t-elle pour les listesrougeetblanc? Que fait la fonctiondim? Que vous retourne-t-elle pour les listesrougeetblanc?

A l"aide des trois questions précédentes, précisez les informations que contiennent nos deux

jeux de données.

Afin d"accéder à une colonne particulière d"une liste, nous pouvons utiliser son nom ou le numéro

de la colonne (elles sont numérotées à partir de1). L"objet retourné est un vecteur contenant les

valeurs de la colonne.pH_rouge <- rouge$pH # Avec le nom de la colonne pH_rouge <- rouge[[9]] # Avec le numéro de la colonne blanc_density <- blanc$density # Avec le nom de la colonne

blanc_density <- blanc[[8]] # Avec le numéro de la colonne3 Quelques fonctions pour manipuler les données

Pour calculer la moyenne uniforme des éléments d"un vecteurv, nous pouvons utiliser la fonc-

tionmean. Voici, par exemple, comment calculer les moyennes des pH des vins rouges et blancs,moy_pH_rouge <- mean(rouge$pH)

moy_pH_blanc <- mean(blanc$pH)Nous allons voir comment calculer des moyennes pondérées avec R et vérifier la formule de

décomposition de la moyenne. Que fait la fonctionc? Utilisez-la pour calculer directement la moyenne uniforme des pH des vins rouges et blancs avecmean. Quel est le poids du groupe des vins rouges? Et celui du groupe des vins blancs? 2 Avec l"aide sur la fonctionweighted.mean, calculez la moyenne pondérée des moyennes de chaque groupe et retrouvez le résultat précédent. Pour calculer des quantiles d"un jeu d"observations stocké dans un vecteurv, nous utilisons la fonctionquantile. Sans plus d"argument, celle-ci calcule les quantiles à0%,25%,50%,75%,

100%. Pour avoir les quantiles à d"autres ordres, il faut manipuler le paramètreprobs.v <- 1:10

quantile(v) # Calcul des quantiles de base

quantile(v, probs=seq(0, 1, 0.1)) # Calcul des décilesEst-ce que les quantiles retournés concordent avec la définition du cours?

A quoi sert le paramètretypede la fonctionquantile? Pour quelle valeur de ce paramètre retrouvons-nous la définition du cours? Calculez les quartiles et la médiane du taux d"alcool dans les vins rouges et celui dans les vins blancs. Commentez les résultats obtenus.

4 Premiers graphiques

Une des forces du logiciel R est la grande variété de graphiques qu"il peut produire et la

facilité avec laquelle l"utilisateur peut créer ses propres graphiques. Nous nous contenterons dans

cette séance d"utiliser des fonctions de base et laissons les paramètres graphiques pour les séances

suivantes.

Dans le cours, nous avons présenté les boîtes à moustaches (ouboxploten anglais). Il s"agit d"un

graphique synthétique très utilisé en pratique. Pour l"afficher, le logiciel R propose une fonction

boxplotqui permet également d"afficher plusieurs diagrammes à moustaches simultanément.boxplot(rouge$pH) # Diagramme pour le pH des vins rouges

boxplot(rouge$pH) # Diagramme pour le pH des vins blancs boxplot(rouge$pH, rouge$pH) # Les deux simultanément

boxplot(rouge) # Pour toutes les variables de la listeQuels commentaires pouvez-vous faire sur le pH des vins rouges et celui des vins blancs à

partir du troisième exemple? Discutez de l"aspect des boîtes dans le quatrième exemple. Quel problème cela pose-t-il? A quoi sert la fonctionscale? Discutez du résultat de la commandeboxplot(scale(rouge)) par rapport à la question précédente. Affichez la boîte à moustaches derouge$residual.sugaret commentez son aspect. Com-

parez ce résultat à la boîte à moustaches des mêmes données auxquelles vous appliquerez la

fonctionf(x) = ln(x)=x1=4. Grâce à l"aide de la fonctionboxplot, vous pouvez commencer à vous familiariser avec certaines options graphiques. Essayez, par exemple, de modifier la couleur de la boîte à moustaches. Pour comparer la répartition de deux jeux de données, nous avons vu le diagramme quantile- quantile (ouQQ-ploten anglais). Ce diagramme se trace avec la fonctionqqplot(le paramètre typepermet de tracer les segments joignant les points), 3 qqplot(rouge$alcohol, blanc$alcohol, type="l")

qqplot(rouge$pH, blanc$pH, type="l")Comment se lisent ces graphiques? Que nous disent-ils sur les répartitions des variables

alcoholetpH? A l"aide de la fonctionabline, vous pouvez tracer une droite par dessus le graphique. Utilisez cette commande pour étayer vos réponses précédentes.

5 Vos propres fonctions

Comme dans tout langage informatique, il est possible d"écrire ses propres fonctions en R. Voici un exemple de fonction qui calcule la variance des observations contenues dans le vecteurvpassé en paramètre avec les poids uniformes.variance <- function(v) { moy <- mean(v) var <- 0 for (i in 1:length(v)) { var <- var + (v[i]-moy)^2 return(var / length(v)) }Notez, en particulier, la syntaxe de la bouclefor. Nous l"utilisons ici pour mettre en évidence les calculs successifs mais, en pratique, ce genre de boucle n"est pas conseillé et il vaut mieux utiliser les fonctions natives de R. Transformez cette fonction pour permettre à l"utilisateur de spécifier les poids qu"il veut utiliser. Comment passer certains poids par défaut si l"utilisateur n"en fournit aucun (les poids uniformes, par exemple)? (Optionnel)Adaptez votre fonction pour qu"elle n"utilise plus de bouclefor. Utilisez pour cela la fonctionweighted.mean. Calculez, avec votre fonction, la variance des pH des vins rouges et blancs ensemble, puis celle des pH des vins rouges uniquement et enfin celle des pH des vins blancs.

Calculez les variances intra et inter. Vérifiez votre résultat à l"aide de la formule de décom-

position de la variance.

6 Pour ceux qui ont fini

Écrivez une fonction qui affiche la fonction de répartition associée aux observations conte-

nues dans un vecteur passé en paramètre. Adaptez votre fonction pour afficher simultanément

deux fonctions de répartition associées à deux jeux de données passés en paramètres. Proposez à

l"utilisateur différentes options graphiques (couleur, ...). 4quotesdbs_dbs29.pdfusesText_35
[PDF] les déciles revenus

[PDF] déciles définition

[PDF] calcul densité lithosphère océanique

[PDF] calculer les expressions suivantes 3eme

[PDF] chimie durable et valorisation du co2 correction

[PDF] la chimie durable activité correction

[PDF] effets des métaux lourds sur l'environnement pdf

[PDF] produit vectoriel exemple

[PDF] bilan de matière exercices

[PDF] bilan matière industrie

[PDF] bilan de matière d'une réaction chimique

[PDF] bilan de matière procédé

[PDF] bilan de matiere chimie

[PDF] bilan matière agroalimentaire

[PDF] bilan matière génie des procédés