[PDF] Analyse statistique des donn´ees dexpression





Previous PDF Next PDF



21 LINTERPRÉTATION DES RÉSULTATS STATISTIQUES Thierry

Détectée sur un ensemble d'observations une relation statistique ne peut concerner que cet ensemble et non chacune des observations. Prenons un exemple précis 



Interprétation statistique des résultats de mesure

Par exemple les travailleurs du Groupe d'Exposition Similaire (GES) sont- ils trop exposés ? Le procédé est-il trop émissif



Analyse statistique des donn´ees dexpression

crit`ere est évidemment prépondérant pour la signification et l'interprétation des résultats. Test multiples. La pratique statistique usuelle vise `a tester 



Statistique Descriptive Multidimensionnelle (pour les nuls)

Elles servent en général. `a affiner l'interprétation des résultats de l'analyse. Ainsi par exemple



Linterprétation des résultats statistiques

1 mars 2001 Prenons un exemple précis : le coefficient de corrélation entre la taille et le poids calculé sur 90 jeunes filles de 20 ans



1 METHODES DANALYSE ET DINTERPRETATION DES ETUDES

Ils servent à obtenir des représentations visuelles et des cartes perceptuelles à partir de programmes d'analyse statistique des données. Par exemple ils.



Introduction a STATA : un exemple détude

Introduction a STATA : un exemple d'étude. Interprétation des résultats. Analyse de la variance F statistique et R2. ? F statistique : teste H0 : ?1.



Guide déconométrie appliquée pour Stata Pour ECN 3950 et FAS

2.6 L'INTERPRÉTATION DES RÉSULTATS. ANNEXE B: EXEMPLE D'UN PROGRAMME STATA COMPLET. ... données qui ont subit un traitement statistique.



Modèle de synthèse pour les résultats de loutil dEQD des enquêtes

l'interprétation des résultats de l'EQD. mentionnée dans le principe 3 « Processus statistiques ») effectuez un recoupement avec les.



Méthodes pratiques de dépouillement de questionnaires

Interprétation des résultats C) Exemple: suite de l'étude des exploitations agricoles ... Cette étude a pour but de montrer l'utilité de la statistique.



[PDF] linterprétation des résultats statistiques - OpenEdition Journals

Prenons un exemple précis : le coefficient de corrélation entre la taille et le poids calculé sur 90 jeunes filles de 20 ans est égal à 0 39913 L'analyse 



[PDF] Interprétation statistique des résultats de mesure - INRS

Par exemple un Groupe d'Exposition Similaire (http://www inrs fr/dms/inrs/PDF/metropol-strategie-principe pdf ) est composé de 10 travailleurs qui réalisent



(PDF) Linterprétation des résultats statistiques - ResearchGate

8 fév 2016 · PDF Most of the social measures are founded currently on statistical results and their interpretations This argumentation is sometimes 



INTERPRÉTATION STATISTIQUE DES RÉSULTATS - Apidologie

INTERPRÉTATION STATISTIQUE DES RÉSULTATS EN MATIÈRE D'ANALYSE POLLINIQUE DES MIELS Ph VERGERON Station de Recherches sur l'Abeille et les l!2sectes 



[PDF] Analyse statistique des donn´ees dexpression

crit`ere est évidemment prépondérant pour la signification et l'interprétation des résultats Test multiples La pratique statistique usuelle vise `a tester 



Interprétation des résultats statistiques - Astrophysique sur Mesure

Par exemple : On peut calculer quel est le poids moyen dans un population donnée par exemple les "hommes français de plus de 18 ans" définir un 



[PDF] 10 Analyse statistique des résultats - APMEP

document plus complet de présentation et d'analyse statistique ; il épreuves (par exemple les résultats de l'épreuve D de cinquième portent sur 2 435



[PDF] Statistiques descriptives et exercices

La statistique est l'étude de la collecte de données leur analyse leur traitement l'in- terprétation des résultats et leur présentation afin de rendre 



[PDF] Statistique Numérique et Analyse des Données

par exemple la permutation) qui ne modifie pas la fréquence des résultats Le but de ce chapitre est d'introduire les statistiques principales et de donner 



[PDF] INTRODUCTION A LANALYSE DES DONNEES

et que l'on utilise en général sans référence à des hypothèses de nature statistique ou à un modèle p cu arti lier''[ ]43 Enfin l'analyse factorielle des 

  • Comment interpréter un résultat en statistiques ?

    Pour interpréter un résultat statistique, on peut utiliser les notions suivantes : médiane et quartile. - La médiane d'un ensemble est une valeur M telle que le nombre de valeurs de l'ensemble supérieures ou égales à M est égal au nombre de valeurs inférieures ou égales à M.
  • Comment interpréter les résultats ?

    Interpréter des résultats signifie donner du sens aux résultats et nous permettre de verifier si notre hypothèse est vraie ou fausse. Comparer les expériences 2 à 2 : on compare l'expérience témoin avec une autre expérience. Les 2 expériences comparées ne doivent avoir qu'UNE SEULE DIFFERENCE
  • Comment interpréter les résultats d'un tableau ?

    Plusieurs étapes sont nécessaires pour lire un tableau. Il faut en repérer la source, l'auteur, la date de publication, le champ (population étudiée, date des données, lieu concernant les données). Il s'agit ensuite de comprendre les données. Pour cela, il peut être utile de repérer le total en lignes ou en colonnes.
  • L'analyse statistique peut être décomposée en cinq étapes :

    1Décrire la nature des données à analyser.2Explorer la relation entre les données et la population correspondante.3Créer un modèle pour synthétiser les relations entre les données et la population.4Prouver (ou réfuter) la validité du modèle.
Analyse statistique des donn´ees dexpression

Analyse statistique des

donn

´ees d"expression

ALAINBACCINI1, PHILIPPEBESSE1, S´EBASTIEND´EJEAN1, PASCALMARTIN2, CHRIST`ELEROBERT-GRANI´E3& MAGALISANCRISTOBAL4

Version d

´ecembre 2008 - mises`a jour et compl´ements : http ://math.univ-toulouse.fr/biostat/ (1)

Institut de Math

´ematiques de Toulouse - UMR CNRS 5219

Laboratoire de Statistique et Probabilit

´es

Universit

´e de Toulouse

(2)

Laboratoire de Pharmacologie-T oxicologie

- (3)

Station d"am

´elioration g´en´etique des animaux

(4)

Laboratoire de g

´en´etique cellulaire

Institut National de la Recherche Agronomique

2

Table des mati

`eres

Avant-propos

9

Motivations

9

Objectif

9

1 Introduction

11

1 Objectifs

11

2 Contenu

12

3 Application aux donn

´ees d"expression. . . . . . . . . . . . . . . . . . . . . . . 13

3.1 Jeux de donn

´ees. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3.2 Sp

´ecificit´es. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.3 Choix m

´ethodologiques initiaux. . . . . . . . . . . . . . . . . . . . . . 14

2 Description statistique

´el´ementaire17

1 Introduction

17

2 Decription d"une variable

17

2.1 Cas quantitatif

17

2.2 Cas qualitatif

19

3 Liaison entre variables

20

3.1 Deux variables quantitatives

20

3.2 Une variable quantitative et une qualitative

22

3.3 Deux variables qualitatives

23

4 Vers le cas multidimensionnel

25

4.1 Matrices des covariances et des corr

´elations. . . . . . . . . . . . . . . . 25

4.2 Tableaux de nuages

25

5 Probl

`emes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

6 Exemple : nutrition chez la souris

26

3 Analyse en Composantes Principales

29

1 introduction

29
3

4TABLE DES MATI`ERES

2 Pr ´esentation´el´ementaire de l"ACP. . . . . . . . . . . . . . . . . . . . . . . . . 30

2.1 Les donn

´ees. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.2 R ´esultats pr´eliminaires. . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.3 R ´esultats g´en´eraux. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.4 R ´esultats sur les variables. . . . . . . . . . . . . . . . . . . . . . . . . 32 2.5 R ´esultats sur les individus. . . . . . . . . . . . . . . . . . . . . . . . . 33

3 Repr

´esentation vectorielle de donn´ees quantitatives. . . . . . . . . . . . . . . . 35

3.1 Notations

35

3.2 Interpr

´etation statistique de la m´etrique des poids. . . . . . . . . . . . . 36

3.3 La m

´ethode. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4 Mod `ele. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.1 Estimation

37
4.2 D ´efinition´equivalente. . . . . . . . . . . . . . . . . . . . . . . . . . . 38

5 Repr

´esentations graphiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

5.1 Les individus

39

5.2 Les variables

41

5.3 Repr

´esentation simultan´ee ou "biplot". . . . . . . . . . . . . . . . . . . 42

6 Choix de dimension

44

6.1 Part d"inertie

44
6.2 R `egle de Kaiser. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 6.3 ´Eboulis des valeurs propres. . . . . . . . . . . . . . . . . . . . . . . . 44

6.4 Diagramme en bo

ˆıte des variables principales. . . . . . . . . . . . . . . 44

7 Interpr

´etation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

8 Donn

´ees d"expression. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

8.1 Exploration

´el´ementaire. . . . . . . . . . . . . . . . . . . . . . . . . . 46

8.2 Analyse en composantes principales

46

9 Exemple : nutrition chez la souris

52

4 Analyse Factorielle Discriminante

57

1 Introduction

57

1.1 Donn

´ees. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

1.2 Objectifs

57

1.3 Notations

58
2 D ´efinition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

2.1 Mod

`ele. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

2.2 Estimation

59
3 R ´ealisation de l"AFD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

TABLE DES MATI

`ERES5

3.1 Matrice

`a diagonaliser. . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3.2 Repr

´esentation des individus. . . . . . . . . . . . . . . . . . . . . . . . 60

3.3 Repr

´esentation des variables. . . . . . . . . . . . . . . . . . . . . . . . 60

3.4 Interpr

´etations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4 Variantes de l"AFD

61

4.1 Individus de m

ˆemes poids. . . . . . . . . . . . . . . . . . . . . . . . . 61 4.2 M ´etrique de Mahalanobis. . . . . . . . . . . . . . . . . . . . . . . . . 62

5 Exemples

62

5 Positionnement multidimensionnel

65

1 Introduction

65

2 Distance, similarit

´es. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 2.1 D ´efinitions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

2.2 Distances entre variables

68

3 Recherche d"une configuration de points

68

3.1 Propri

´et´es. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

3.2 Explicitation du MDS

69

4 Application au choix de variables

70

5 Donn

´ees d"expression. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

6 Exemple : nutrition chez la souris

74

6 Classification

77

1 Introduction

77

1.1 Les donn

´ees. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

1.2 Les objectifs

77

1.3 Les m

´ethodes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

2 Illustration

79

3 Mesures d"

´eloignement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

3.1 Indice de ressemblance, ou similarit

´e. . . . . . . . . . . . . . . . . . . 82

3.2 Indice de dissemblance, ou dissimilarit

´e. . . . . . . . . . . . . . . . . . 82

3.3 Indice de distance

83

3.4 Distance

83

3.5 Distance euclidienne

83

3.6 Utilisation pratique

83

3.7 Bilan

84

4 Classification ascendante hi

´erarchique. . . . . . . . . . . . . . . . . . . . . . . 84

4.1 Principe

84

4.2 Distance, ou dissemblance, entre deux classes

84

6TABLE DES MATI`ERES

4.3 Algorithme

85

4.4 Graphes

85
5 Agr ´egation autour de centres mobiles. . . . . . . . . . . . . . . . . . . . . . . 85

5.1 Principes

85

5.2 Principale m

´ethode. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.3 Propri

´et´es. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.4 Variantes

86

5.5 Combinaison

87

6 Donn

´ees d"expression. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

7 Exemple : nutrition chez la souris

91
7 Mod `ele lin´eaire et r´egression95

1 Introduction

95

2 Le mod

`ele de r´egression simple. . . . . . . . . . . . . . . . . . . . . . . . . . 95

2.1 Ecriture et hypoth

`eses du mod`ele. . . . . . . . . . . . . . . . . . . . . 96

2.2 Le mod

`ele lin´eaire gaussien. . . . . . . . . . . . . . . . . . . . . . . . 97

2.3 Estimation des param

`etres1et2. . . . . . . . . . . . . . . . . . . .98

2.4 Propri

´et´es des estimateurs. . . . . . . . . . . . . . . . . . . . . . . . . 100

2.5 Estimation ponctuelle de2. . . . . . . . . . . . . . . . . . . . . . . .100

2.6 Tests d"hypoth

`ese et intervalles de confiance. . . . . . . . . . . . . . . 100 2.7 V ´erification des hypoth`eses. . . . . . . . . . . . . . . . . . . . . . . . 101 3 R ´egression lineaire multiple. . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

3.1 Multicolin

´earit´e. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

3.2 Crit

`eres de s´election de mod`ele. . . . . . . . . . . . . . . . . . . . . . 107 8 Mod `ele lin´eaire : analyse de variance109

1 ANOVA

`a un facteur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

1.1 Un exemple

109

1.2 Diverses param

´etrisations. . . . . . . . . . . . . . . . . . . . . . . . . 110 1.3 V ´erification des hypoth`eses - Diagnostics. . . . . . . . . . . . . . . . . 111

1.4 Estimation des param

`etres. . . . . . . . . . . . . . . . . . . . . . . . . 112

1.5 Intervalle de confiance et tests d"hypoth

`eses. . . . . . . . . . . . . . . . 112

2 ANOVA

`a deux facteurs crois´es. . . . . . . . . . . . . . . . . . . . . . . . . . 114

3 Analyse de covariance

116

4 Tests multiples

117

4.1 Rappels sur les risques de premi

`ere et seconde esp`ece. . . . . . . . . . . 117

4.2 Tests multiples

117
5 Mod `ele lin´eaire mixte gaussien. . . . . . . . . . . . . . . . . . . . . . . . . . . 118

TABLE DES MATI

`ERES7

5.1 Exemple 1

119

5.2 Exemple 2

119

5.3 Exemple 3

120
5.4 D ´efinition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

6 Exemple : nutrition chez la souris

122

6.1 Analyses de variance et mod

`ele mixte. . . . . . . . . . . . . . . . . . . 122

6.2 Principe des analyses de variance

122

6.3 Synth

`ese des tests multiples. . . . . . . . . . . . . . . . . . . . . . . . 123

6.4 Mod

`ele mixte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

En guise de conclusion

129

A Annexes

133

1 Analyse canonique

133
2 Mod `ele lin´eaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

8TABLE DES MATI`ERES

Avant-propos

Motivations

Le d ´eveloppement des moyens informatiques de stockage (bases de donn´ees) et de calcul permet le traitement et l"analyse d"ensembles de donn

´ees tr`es volumineux. De plus, le perfec-

tionnement des interfaces offre aux utilisateurs, statisticiens ou non, des possibilit

´es de mise en

oeuvre tr `es simples des outils logiciels. Dans ce contexte, le biologiste dispose d"un corpus rela- tivement sophistiqu ´e de techniques statistiques utilisables sur les donn´ees d"expression des g`enes produites par PCR, macro ou microarrays (biopuces). Les logiciels commerciaux ou non offrent des ´eventails plus ou moins larges d"acc`es`a ces techniques dans une pr´esentation plus ou moins explicite voire "bo ˆıte noire". Intentionnellement ce cours a fait le choix d"illustrer les techniques par un logiciel, le plus complet et le plus explicite possible : R. M

ˆeme s"il ne semble pas le plus

simple d"utilisation par rapport `a certains produits commerciaux privil´egiant une interface gra- phique "conviviale", son utilisation incite `a l"indispensable compr´ehension des m´ethodes et de leurs limites. Il fait bien admettre qu"il ne suffit pas d"obtenir des r

´esultats, il faut leur donner du

sens. Rien ne nous semble en effet plus dangereux que des r

´esultats ou des graphiques obtenus

a l"aide de quelques clics de mulot dont ni les techniques, ni les options, ni leurs limites ne sont clairement explicit

´ees ou contrˆol´ees par l"utilisateur. Il est par ailleurs risqu´e de se laisser enfermer

par les seules m ´ethodes et options offertes par "un" logiciel. En pratique, le r´eagencement ou la r

´eorganisation de quelques commandes R offrent une combinatoire tr`es ouvertes de possibilit´es

contrairement `a un syst`eme clos de menus pr´ed´efinis. Il offre par ailleurs, grˆace`a de nombreuses bo

ˆıtes`a outils librement accessibles et continuellement mises`a jour, un ensemble exhaustif des

techniques et de leurs options ainsi que des interfaces `a des gestionnaires de bases de donn´ees ou des outils sp ´ecifiques`a l"´etude des biopuces (Bioconductor).

Objectifs g

´en´eraux

Ce cours se place en aval d"une pr

´esentation des probl`emes de planification, d"acquisition et de transformation (traitement d"image, normalisation) des donn

´ees d"expression. D"autres cours

et r

´ef´erences existent sur ces points (voir page web), ils ne sont pas d´evelopp´es ici mˆeme s"ils sont

tout aussi influents sur la pertinence et la qualit ´e des r´esultats obtenus. Les m´ethodes s´electionn´ees sont celles paraissant les plus adapt ´ees`a la repr´esentation graphique des donn´ees d"expression et

a la construction de mod`eles explicatifs. Il s"agit de rechercher les repr´esentations graphiques

les plus ´eclairantes pour la compr´ehension de ce type de donn´ees, de leurs structures, puis de rechercher ou d"inf

´erer des hypoth`eses sp´ecifiques.

Ce cours se propose donc d"introduire deux grandes familles de m

´ethodes sous une forme

homog `ene, synth´etique et relativementintuitiveen privil´egiant la mise en oeuvre pratique aux d

´eveloppements th´eoriques. Sont ainsi trait´es des exemples simples, acad´emiques, et d"autres plus

9

10TABLE DES MATI`ERES

complexes mais provenant d"exp ´eriences r´eelles de mesures d"expressions. i. T echniquesstatistiques exploratoiresditesmultidimensionnellesrecouvrant d"une part les m ´ethodesfactorielleset d"autre part les m´ethodes declassificationou apprentissage non- supervis

´e.

ii. M ´ethodes statistiques ditesinf´erentielleset demod´elisation: tests, tests multiples et le mod `ele lin´eairesous diff´erentes formes (r´egression, analyse de variance, mod`ele mixte).

D"autres techniques plus r

´ecentes avec un objectif de discrimination et issues de la th´eorie de l"apprentissage (agr ´egation de mod`eles, support vector machine...) ont volontairement´et´e laiss´ees de c ˆot´e. Elles n´ecessiteraient plus de temps pourˆetre abord´ees. Ce d

´eroulement p´edagogique lin´eaire ne doit pas faire perdre de vue que la r´ealit´e d"une ana-

lyse est plus complexe et n ´ecessite diff´erentes´etapes en boucle afin, par exemple, de contrˆoler l"influence possible des choix parfois tr `es subjectifs op´er´es dans les´etapes de normalisation pour eventuellement les remettre en cause. L"objectif principal est donc de faciliter la mise en oeuvre, la compr

´ehension et l"interpr´etation

des r

´esultats des techniques d´ecrites pour en faciliter uneutilisation pertinente et r´efl´echie`a l"aide

d"un logiciel (R) largement r ´epandus dans la communaut´e scientifique. Ce cours ne peut se conce- voir sans une mise en oeuvre pratique au cours de s

´eances de travaux dirig´es sur machine.

Remerciements

Un grand merci

`a Agn`es Bonnet, Heinrick Laurell, Pascal Martin, Gwenola Tosser-Klopp et Nathalie Viguerie pour les discussions scientifiques autour de leurs donn

´ees respectives.

Chapitre 1

Introduction

1 Objectifs

Toute

´etude sophistiqu´ee d"un corpus de donn´ees et leur mod´elisation sont pr´ec´ed´ees d"une

graphiques. C"est la seule fac¸on de se familiariser avec des donn

´ees et surtout de d´epister les

sources de probl `emes :quotesdbs_dbs29.pdfusesText_35
[PDF] interprétation moyenne statistique

[PDF] interprétation statistique descriptive

[PDF] comprendre les statistiques maths

[PDF] analyse et interprétation des données statistiques

[PDF] exemple détiquette alimentaire

[PDF] etiquettes alimentaires mode d'emploi

[PDF] compression d'image avec perte

[PDF] algorithme de compression d'image

[PDF] code crc exercice corrigé

[PDF] iodure de potassium prix

[PDF] iodure de potassium achat

[PDF] iodure de potassium utilisation

[PDF] iodure de potassium pharmacie

[PDF] iodure de plomb

[PDF] iodure de potassium indication