[PDF] [PDF] Analyse statistique des donn´ees dexpression





Previous PDF Next PDF



Analyse statistique des donn´ees dexpression

permet le traitement et l'analyse d'ensembles de données tr`es volumineux. Méthodes statistiques dites inférentielles et de modélisation : tests ...



Statistique Numérique et Analyse des Données

qu'il n'est pas utile d'appliquer la méthodologie statistique aux données recueillies Afin que l'analyse statistique d'une série numérique ait un sens ...



Présentation des méthodes de collecte et danalyse de données

d'analyse – la méthode pour analyser le « sens » des données en recherchant des Il existe d'autres sources de données notamment : les statistiques ...



INTRODUCTION A LANALYSE DES DONNEES

Cette amélioration continue de l'outil informatique a fortement contribué au développement et à la vulgarisation de nombreuses méthodes statistiques devenues.



Un exemple de lutilisation des méthodes de lanalyse des données

Il est bien connu pour les économistes que la simple recherche de liaisons statistiques ne peut donner de résultats fiables sans une réflexion théorique 



Guide de validation des méthodes danalyses

28 oct. 2015 vue de la validation d'une méthode d'analyse quantitative par construction du profil d'exactitude. NF ISO 3534-1 : 2007 Statistiques.



Quatre approches pour lanalyse de données textuelles: lexicale

10 mai 2013 L'Analyse de Données Textuelles (A.D.T.) regroupe les méthodes qui visent ... statistiques du texte offre surtout la possibilité de lectures ...



Manuel danalyse des données et de rapports statistiques sur le

plan d'échantillonnage et l'analyse des données 9. Méthodes de saisie des données. Les rapports nationaux devraient inclure des.



Limplication statistique une nouvelle méthode danalyse de données

L'implication statistique une nouvelle méthode d'analyse de données. Mathématiques et sciences humaines



Les méthodes danalyse en recherche quantitative: une introduction

L'analyse descriptive des données permet au chercheur de résumer un ensemble de données brutes à l'aide de techniques statistiques. Ce type d'analyse vise 



[PDF] Analyse statistique des donn´ees dexpression

Méthodes statistiques dites inférentielles et de modélisation : tests tests multiples et le mod`ele linéaire sous différentes formes (régression analyse 



[PDF] Statistique Numérique et Analyse des Données

Le but de ce chapitre est de présenter les outils graphiques les plus répandus de la statis- tique descriptive On considérera les cas d'une série numérique 



[PDF] INTRODUCTION A LANALYSE DES DONNEES

BUREAU D'APPLICATION DES METHODES STATISTIQUES ET INFORMATIQUES BAMSI REPRINT 04/2003 Introduction à l'analyse des données Samuel AMBAPOUR BBAAMMSSII



[PDF] Méthodologies statistiques pour le recueil et lanalyse de données

2 juil 2019 · Elles s'inspirent en partie de deux méthodes de caractérisation utilisées en analyse sensorielle : le tri libre et la Q- méthodologie binaire



[PDF] Présentation des méthodes de collecte et danalyse de données

d'analyse – la méthode pour analyser le « sens » des données en recherchant des Il existe d'autres sources de données notamment : les statistiques 



[PDF] COURS DANALYSE DES DONNÉES

Les techniques d'analyse des données ont connu un essor important surtout avec le important dans la prévision en se basant sur des méthodes statistiques



[PDF] Cours: Analyse des données

contribué au développement de nombreuses méthodes statistiques ? Ce qui permet de traiter sans difficultés de vastes données des enquêtes et des 



[PDF] Méthodologies de collecte et danalyse des données pour le suivi et

Analyse des données quantitatives les suivants : finalité de la collecte de données méthodologie de la pour procéder aux analyses statistiques



[PDF] Études de cas en analyse des données - Université de Sherbrooke

28 jui 2021 · différentes méthodes d'analyse de données multidimensionnelles abordées R Principalement destiné aux statistiques et à la science des 



Un exemple de lutilisation des méthodes de lanalyse des données

Il est bien connu pour les économistes que la simple recherche de liaisons statistiques ne peut donner de résultats fiables sans une réflexion théorique 

  • Quelles sont les méthodes d'analyse statistique ?

    Qu'est-ce qu'une méthode d'analyse de données ? En Data Analysis, une méthode d'analyse est un processus statistique, informatique ou dérivé de l'IA qui permet d'extraire le maximum d'informations exploitables d'un groupe de données à disposition.
[PDF] Analyse statistique des donn´ees dexpression

Analyse statistique des

donn

´ees d"expression

ALAINBACCINI1, PHILIPPEBESSE1, S´EBASTIEND´EJEAN1, PASCALMARTIN2, CHRIST`ELEROBERT-GRANI´E3& MAGALISANCRISTOBAL4

Version d

´ecembre 2008 - mises`a jour et compl´ements : http ://math.univ-toulouse.fr/biostat/ (1)

Institut de Math

´ematiques de Toulouse - UMR CNRS 5219

Laboratoire de Statistique et Probabilit

´es

Universit

´e de Toulouse

(2)

Laboratoire de Pharmacologie-T oxicologie

- (3)

Station d"am

´elioration g´en´etique des animaux

(4)

Laboratoire de g

´en´etique cellulaire

Institut National de la Recherche Agronomique

2

Table des mati

`eres

Avant-propos

9

Motivations

9

Objectif

9

1 Introduction

11

1 Objectifs

11

2 Contenu

12

3 Application aux donn

´ees d"expression. . . . . . . . . . . . . . . . . . . . . . . 13

3.1 Jeux de donn

´ees. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3.2 Sp

´ecificit´es. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.3 Choix m

´ethodologiques initiaux. . . . . . . . . . . . . . . . . . . . . . 14

2 Description statistique

´el´ementaire17

1 Introduction

17

2 Decription d"une variable

17

2.1 Cas quantitatif

17

2.2 Cas qualitatif

19

3 Liaison entre variables

20

3.1 Deux variables quantitatives

20

3.2 Une variable quantitative et une qualitative

22

3.3 Deux variables qualitatives

23

4 Vers le cas multidimensionnel

25

4.1 Matrices des covariances et des corr

´elations. . . . . . . . . . . . . . . . 25

4.2 Tableaux de nuages

25

5 Probl

`emes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

6 Exemple : nutrition chez la souris

26

3 Analyse en Composantes Principales

29

1 introduction

29
3

4TABLE DES MATI`ERES

2 Pr ´esentation´el´ementaire de l"ACP. . . . . . . . . . . . . . . . . . . . . . . . . 30

2.1 Les donn

´ees. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.2 R ´esultats pr´eliminaires. . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2.3 R ´esultats g´en´eraux. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.4 R ´esultats sur les variables. . . . . . . . . . . . . . . . . . . . . . . . . 32 2.5 R ´esultats sur les individus. . . . . . . . . . . . . . . . . . . . . . . . . 33

3 Repr

´esentation vectorielle de donn´ees quantitatives. . . . . . . . . . . . . . . . 35

3.1 Notations

35

3.2 Interpr

´etation statistique de la m´etrique des poids. . . . . . . . . . . . . 36

3.3 La m

´ethode. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4 Mod `ele. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.1 Estimation

37
4.2 D ´efinition´equivalente. . . . . . . . . . . . . . . . . . . . . . . . . . . 38

5 Repr

´esentations graphiques. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

5.1 Les individus

39

5.2 Les variables

41

5.3 Repr

´esentation simultan´ee ou "biplot". . . . . . . . . . . . . . . . . . . 42

6 Choix de dimension

44

6.1 Part d"inertie

44
6.2 R `egle de Kaiser. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 6.3 ´Eboulis des valeurs propres. . . . . . . . . . . . . . . . . . . . . . . . 44

6.4 Diagramme en bo

ˆıte des variables principales. . . . . . . . . . . . . . . 44

7 Interpr

´etation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

8 Donn

´ees d"expression. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

8.1 Exploration

´el´ementaire. . . . . . . . . . . . . . . . . . . . . . . . . . 46

8.2 Analyse en composantes principales

46

9 Exemple : nutrition chez la souris

52

4 Analyse Factorielle Discriminante

57

1 Introduction

57

1.1 Donn

´ees. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

1.2 Objectifs

57

1.3 Notations

58
2 D ´efinition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

2.1 Mod

`ele. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

2.2 Estimation

59
3 R ´ealisation de l"AFD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

TABLE DES MATI

`ERES5

3.1 Matrice

`a diagonaliser. . . . . . . . . . . . . . . . . . . . . . . . . . . 60

3.2 Repr

´esentation des individus. . . . . . . . . . . . . . . . . . . . . . . . 60

3.3 Repr

´esentation des variables. . . . . . . . . . . . . . . . . . . . . . . . 60

3.4 Interpr

´etations. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4 Variantes de l"AFD

61

4.1 Individus de m

ˆemes poids. . . . . . . . . . . . . . . . . . . . . . . . . 61 4.2 M ´etrique de Mahalanobis. . . . . . . . . . . . . . . . . . . . . . . . . 62

5 Exemples

62

5 Positionnement multidimensionnel

65

1 Introduction

65

2 Distance, similarit

´es. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 2.1 D ´efinitions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

2.2 Distances entre variables

68

3 Recherche d"une configuration de points

68

3.1 Propri

´et´es. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

3.2 Explicitation du MDS

69

4 Application au choix de variables

70

5 Donn

´ees d"expression. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

6 Exemple : nutrition chez la souris

74

6 Classification

77

1 Introduction

77

1.1 Les donn

´ees. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

1.2 Les objectifs

77

1.3 Les m

´ethodes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

2 Illustration

79

3 Mesures d"

´eloignement. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

3.1 Indice de ressemblance, ou similarit

´e. . . . . . . . . . . . . . . . . . . 82

3.2 Indice de dissemblance, ou dissimilarit

´e. . . . . . . . . . . . . . . . . . 82

3.3 Indice de distance

83

3.4 Distance

83

3.5 Distance euclidienne

83

3.6 Utilisation pratique

83

3.7 Bilan

84

4 Classification ascendante hi

´erarchique. . . . . . . . . . . . . . . . . . . . . . . 84

4.1 Principe

84

4.2 Distance, ou dissemblance, entre deux classes

84

6TABLE DES MATI`ERES

4.3 Algorithme

85

4.4 Graphes

85
5 Agr ´egation autour de centres mobiles. . . . . . . . . . . . . . . . . . . . . . . 85

5.1 Principes

85

5.2 Principale m

´ethode. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.3 Propri

´et´es. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

5.4 Variantes

86

5.5 Combinaison

87

6 Donn

´ees d"expression. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88

7 Exemple : nutrition chez la souris

91
7 Mod `ele lin´eaire et r´egression95

1 Introduction

95

2 Le mod

`ele de r´egression simple. . . . . . . . . . . . . . . . . . . . . . . . . . 95

2.1 Ecriture et hypoth

`eses du mod`ele. . . . . . . . . . . . . . . . . . . . . 96

2.2 Le mod

`ele lin´eaire gaussien. . . . . . . . . . . . . . . . . . . . . . . . 97

2.3 Estimation des param

`etres1et2. . . . . . . . . . . . . . . . . . . .98

2.4 Propri

´et´es des estimateurs. . . . . . . . . . . . . . . . . . . . . . . . . 100

2.5 Estimation ponctuelle de2. . . . . . . . . . . . . . . . . . . . . . . .100

2.6 Tests d"hypoth

`ese et intervalles de confiance. . . . . . . . . . . . . . . 100 2.7 V ´erification des hypoth`eses. . . . . . . . . . . . . . . . . . . . . . . . 101 3 R ´egression lineaire multiple. . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

3.1 Multicolin

´earit´e. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

3.2 Crit

`eres de s´election de mod`ele. . . . . . . . . . . . . . . . . . . . . . 107 8 Mod `ele lin´eaire : analyse de variance109

1 ANOVA

`a un facteur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

1.1 Un exemple

109

1.2 Diverses param

´etrisations. . . . . . . . . . . . . . . . . . . . . . . . . 110 1.3 V ´erification des hypoth`eses - Diagnostics. . . . . . . . . . . . . . . . . 111

1.4 Estimation des param

`etres. . . . . . . . . . . . . . . . . . . . . . . . . 112

1.5 Intervalle de confiance et tests d"hypoth

`eses. . . . . . . . . . . . . . . . 112

2 ANOVA

`a deux facteurs crois´es. . . . . . . . . . . . . . . . . . . . . . . . . . 114

3 Analyse de covariance

116

4 Tests multiples

117

4.1 Rappels sur les risques de premi

`ere et seconde esp`ece. . . . . . . . . . . 117

4.2 Tests multiples

117
5 Mod `ele lin´eaire mixte gaussien. . . . . . . . . . . . . . . . . . . . . . . . . . . 118

TABLE DES MATI

`ERES7

5.1 Exemple 1

119

5.2 Exemple 2

119

5.3 Exemple 3

120
5.4 D ´efinition. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

6 Exemple : nutrition chez la souris

122

6.1 Analyses de variance et mod

`ele mixte. . . . . . . . . . . . . . . . . . . 122

6.2 Principe des analyses de variance

122

6.3 Synth

`ese des tests multiples. . . . . . . . . . . . . . . . . . . . . . . . 123

6.4 Mod

`ele mixte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 126

En guise de conclusion

129

A Annexes

133

1 Analyse canonique

133
2 Mod `ele lin´eaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

8TABLE DES MATI`ERES

Avant-propos

Motivations

Le d ´eveloppement des moyens informatiques de stockage (bases de donn´ees) et de calcul permet le traitement et l"analyse d"ensembles de donn

´ees tr`es volumineux. De plus, le perfec-

tionnement des interfaces offre aux utilisateurs, statisticiens ou non, des possibilit

´es de mise en

oeuvre tr `es simples des outils logiciels. Dans ce contexte, le biologiste dispose d"un corpus rela- tivement sophistiqu ´e de techniques statistiques utilisables sur les donn´ees d"expression des g`enes produites par PCR, macro ou microarrays (biopuces). Les logiciels commerciaux ou non offrent des ´eventails plus ou moins larges d"acc`es`a ces techniques dans une pr´esentation plus ou moins explicite voire "bo ˆıte noire". Intentionnellement ce cours a fait le choix d"illustrer les techniques par un logiciel, le plus complet et le plus explicite possible : R. M

ˆeme s"il ne semble pas le plus

simple d"utilisation par rapport `a certains produits commerciaux privil´egiant une interface gra- phique "conviviale", son utilisation incite `a l"indispensable compr´ehension des m´ethodes et de leurs limites. Il fait bien admettre qu"il ne suffit pas d"obtenir des r

´esultats, il faut leur donner du

sens. Rien ne nous semble en effet plus dangereux que des r

´esultats ou des graphiques obtenus

a l"aide de quelques clics de mulot dont ni les techniques, ni les options, ni leurs limites ne sont clairement explicit

´ees ou contrˆol´ees par l"utilisateur. Il est par ailleurs risqu´e de se laisser enfermer

par les seules m ´ethodes et options offertes par "un" logiciel. En pratique, le r´eagencement ou la r

´eorganisation de quelques commandes R offrent une combinatoire tr`es ouvertes de possibilit´es

contrairement `a un syst`eme clos de menus pr´ed´efinis. Il offre par ailleurs, grˆace`a de nombreuses bo

ˆıtes`a outils librement accessibles et continuellement mises`a jour, un ensemble exhaustif des

techniques et de leurs options ainsi que des interfaces `a des gestionnaires de bases de donn´ees ou des outils sp ´ecifiques`a l"´etude des biopuces (Bioconductor).

Objectifs g

´en´eraux

Ce cours se place en aval d"une pr

´esentation des probl`emes de planification, d"acquisition et de transformation (traitement d"image, normalisation) des donn

´ees d"expression. D"autres cours

et r

´ef´erences existent sur ces points (voir page web), ils ne sont pas d´evelopp´es ici mˆeme s"ils sont

tout aussi influents sur la pertinence et la qualit ´e des r´esultats obtenus. Les m´ethodes s´electionn´ees sont celles paraissant les plus adapt ´ees`a la repr´esentation graphique des donn´ees d"expression et

a la construction de mod`eles explicatifs. Il s"agit de rechercher les repr´esentations graphiques

les plus ´eclairantes pour la compr´ehension de ce type de donn´ees, de leurs structures, puis de rechercher ou d"inf

´erer des hypoth`eses sp´ecifiques.

Ce cours se propose donc d"introduire deux grandes familles de m

´ethodes sous une forme

homog `ene, synth´etique et relativementintuitiveen privil´egiant la mise en oeuvre pratique aux d

´eveloppements th´eoriques. Sont ainsi trait´es des exemples simples, acad´emiques, et d"autres plus

9quotesdbs_dbs32.pdfusesText_38
[PDF] introduction ? l'analyse économique pdf

[PDF] introduction ? lanalyse économique licence 1

[PDF] cours danalyse économique licence 1 pdf

[PDF] analyse économique exercices corrigés pdf

[PDF] exercice corrigé spectroscopie uv visible

[PDF] exercice corrigé spectre uv visible terminale s

[PDF] prononciation ancien français mp3

[PDF] traduction de l'ancien français au français moderne

[PDF] programmation android pour les nuls

[PDF] programmation android pour les nuls pdf

[PDF] tuto android studio francais

[PDF] question tags exercices

[PDF] question tags rules pdf

[PDF] question tags exercises with answers pdf

[PDF] prepositions exercises with answers pdf