[PDF] Bases statistiques (pour la biologie)





Previous PDF Next PDF



Bases statistiques (pour la biologie)

18 janv. 2017 La statistique permet de répondre à de nombreuses questions ... Comptage du nombre d'événements au cours d'un intervalle de temps.



Cours de Statistiques niveau L1-L2

7 mai 2018 https://team.inria.fr/steep/files/2015/03/cours.pdf. Notes de cours d'Olivier ... Biologie médecine : essais thérapeutiques



Cours de Biostatistique

est l'application des statistiques en biologie ; sachant que la statistique est la science dont l'objet est de recueillir



Cours de Statistique

Cours de Statistique La statistique descriptive traite des propriétés des population plus que des ... Département de biologie appliquée SNV



Cours de Statistique pour Licence troisi`eme année de Biologie

1 Analyse de la variance `a un facteur - Test de comparaison de plusieurs moyennes théoriques. 5. 1.1 Mod`ele .



Statistique et biologie

Dpt de biologie La statistique permet de répondre à de nombreuses questions biologiques. Exemples ... Deux grands chapitres sont présentés dans ce cours.



Aide-mémoire de statistique appliquée à la biologie

enseigné formé et conseillé en statistique appliquée à la biologie. cours de l'expérience (i.e. population infinie ou tirages avec remise).



Résumé du Cours de Statistique Descriptive

15 déc. 2010 http://cran.r-project.org/doc/contrib/Paradis-rdebuts_fr.pdf ... statistique s'applique `a la plupart des disciplines : agronomie biologie



Méthodes statistiques appliquées à la biologie

Thèmes abordés. Ce cours aborde des méthodes d'inférence statistiques avancées pour l'analyse des données biologiques : les modèles linéaires généralisés.



MAP 574 Méthodes statistiques pour la biologie

Christophe Giraud. CMAP Ecole Polytechnique cours introductif `a la statistique. 1/103. Christophe Giraud. MAP 574 Méthodes statistiques pour la biologie 

Bases statistiques (pour la biologie)

18-20 janvier 2017

Cyril Dalmasso

(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 1 / 251

1Introduction

2Statistique descriptive

3Rappels de probabilités

4Estimation

5Tests d"hypothèses

6Modèle linéaire

7Modèle linéaire généralisé

(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 2 / 251

Introduction

1Introduction

2Statistique descriptive

3Rappels de probabilités

4Estimation

5Tests d"hypothèses

6Modèle linéaire

7Modèle linéaire généralisé

(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 3 / 251

Introduction

Exemple introductif

On s"intéresse à l"effet d"une dose faible de cambendazole sur les infections des souris par la Trichinella Spiralis... (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 4 / 251

Introduction

Exemple introductif

On s"intéresse à l"effet d"une dose faible de cambendazole sur les infections des souris par la Trichinella Spiralis. 16 souris ont été infectées par un même nombre de larves de Trichinella et ensuite réparties au hasard entre deux groupes. Le premier groupe de 8 souris a reçu du cambendazole, à raison de 10 mg par kilo, 60 heures après l"infection. Les 8 autres souris n"ont pas reçu de traitement. Au bout d"une semaine, toutes les souris ont été sacrifiées et les nombres suivants de vers adultes ont été retrouvés dans les intestins :Souris non traitées5155624568714679

Souris traitées4553525157516888

Que peut-on dire au sujet d"une éventuelle efficacité du cambendazole, dosé à 10mg / kg pour le traitement des infections des souris par la

Trichinella Spiralis?

(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 5 / 251

Introduction

Statistique et biologie

La statistique permet de répondre à de nombreuses questions biologiques.Exemples Quelle sont les valeurs normales de grandeurs biologiques (taille, poids, glycémie, ...)?Les niveaux d"expression de deux gènes sont-ils différents? Un nouveau traitement est-il plus efficace que le traitement de référence?Peut-on définir de nouvelles typologies de tumeurs?

Un test de dépistage est-il fiable?

Les modifications de poids d"un individu sont-elles liées aux modifications de cholestérolémie? (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 6 / 251

Introduction

Statistique

Statistique : étude de la variabilitéDéfinitions Le termestatistiqueest utilisé pour désigner trois notions distinctes :1Recueil de données

2Méthodes utilisées pour analyser ces données

3Toute grandeur calculée à partir d"observations

(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 7 / 251

Introduction

Statistique

Définitions

On appellestatistique descriptivel"ensemble des méthodes et techniques mathématiques permettant de représenter, de décrire et de

résumer un ensemble de données.On appellestatistique inférentielle(ou inductive) l"ensemble des

méthodes visant à modéliser un ensemble de données afin de tirer des conclusions sur un ensemble plus vaste.Remarque La statistique repose sur des modèles et des hypothèses issus des probabilités. (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 8 / 251

Introduction

Démarche statistique

(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 9 / 251

Introduction

Statistiques et probabilités

Statistiques et probabilités sont deux aspects complémentaires de l"étude des phénomènes aléatoires (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 10 / 251

Introduction

Objectifs de la formation

Donner les bases nécessaires pour :Comprendre les méthodes utilisées

Savoir interpréter des résultats

Réaliser des analyses statistiques élémentaires (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 11 / 251

Statistique descriptive

Statistique descriptive

Objectif

Organiser et résumer les données afin d"en dégager les caractéristiques principales sous une forme simple et intelligibleRemarque La statistique descriptive permet notamment d"identifier des valeurs

extrêmes ou aberrantes et de vérifier certaines hypothèses de modélisationTypes de représentation

Tableaux

Graphiques

Indicateurs numériques

(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 12 / 251

Statistique descriptive

Vocabulaire

Population: ensemble (grand, voire infini) d"individus ou d"objets de

même natureEchantillon: sous ensemble de la populationCaractère / Variable: une caractéristique de la population pouvant

prendre différentes valeursModalité: toute valeur que peut prendre une variableSérie statistique: ensemble des données recueillie pour un caractère

donné à partir d"un échantillon (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 13 / 251

Statistique descriptive

Types de variables

Variablequantitative: variable/caractère à laquelle on peut associer

un nombrediscrète: ne peut prendre qu"un nombre fini ou dénombrable de valeurscontinue: peut prendre toutes les valeurs d"un intervalle de l"ensemble

des nombres réelsVariablequalitative: variable/caractère dont les modalités ne sont

pas quantifiablesordinale: variable dont les modalités peuvent être ordonnéesnominale: variable dont les modalités ne peuvent pas être ordonnées(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 14 / 251

Statistique descriptiveIndicateurs numérique

Indicateurs numériques

Les indicateurs numériques n"ont de sens que pour des variables quantitativesIndicateurs de position Mode

Moyenne empirique

Quantiles empiriques

Médiane empirique

Indicateurs de dispersion

Etendue

Intervalle interquartile

Variance empirique

(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 15 / 251

Statistique descriptiveIndicateurs numérique

Indicateurs de position

Mode Pour une variable discrète, le mode est la modalitéxiayant la plus grande fréquence.Pour une variable continue, le mode est le centre de la classe ayant la plus grande fréquence.Remarque

Une variable peut avoir plusieurs modes.

(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 16 / 251

Statistique descriptiveIndicateurs numérique

Indicateurs de position

Moyenne empirique

La moyenne empirique d"un échantillon est la moyenne arithmétique des observations :

¯x=1n

n i=1x

i(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 17 / 251

Statistique descriptiveIndicateurs numérique

Indicateurs de position

Quantiles empiriques

Le quantile empirique d"ordre1/p(oùpest un entier naturel) est la valeur ˜q1/pqui partage l"échantillon enpparties de même effectif.Quantiles particuliers

Médiane empirique: quantile d"ordre1/2Quartiles: quantile d"ordrei/4Déciles: quantile d"ordrei/10Centiles: quantile d"ordrei/100(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 18 / 251

Statistique descriptiveIndicateurs numérique

Indicateurs de position

observations ordonnées.Médiane empirique La médiane empirique est le quantile d"ordre1/2:Sinest impair :

˜x=x(n+12

)Sinest pair :

Toute valeur comprise entrex(n2

)etx(n2

+1)(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 19 / 251

Statistique descriptiveIndicateurs numérique

Indicateurs de position

Exemplevtemp

Frequency

-4-20246 0 100
200
300
400
min

1er quartile

mediane moyenne

3eme quartile

max(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 20 / 251

Statistique descriptiveIndicateurs numérique

Indicateurs de dispersion

Etendue

L"étendue mesure l"écart entre la plus grande et la plus petite des valeurs observées. Elle est définie par : e

n=max(xi)-min(xi)(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 21 / 251

Statistique descriptiveIndicateurs numérique

Indicateurs de dispersion

Distance interquartile

L"intervalle interquartilesest l"intervalle :

[˜q1/4;˜q3/4] . Il contient la moitié la plus centrale des observations.La longueur de cet intervalle q=q3-q1 est appeléedistance interquartile. Cette quantité est un indicateur de dispersion. (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 22 / 251

Statistique descriptiveIndicateurs numérique

Indicateurs de dispersion

Variance empirique

La variance empirique d"un échantillon est définie par : s 2=1n n i=1(xi-x n)2=1n n i=1x2i-x 2n Elle mesure l"écart quadratique moyen de l"échantillon à sa moyenne.Ecart-type

L"écart-type est défini par :

s=⎷s 2 Contrairement à la variance empirique, il est exprimé dans la même unité

de mesure que le caractèreX.(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 23 / 251

Statistique descriptiveIndicateurs numérique

Indicateurs de dispersion

Variance empirique corrigée

La variance empirique corrigée est définie par : s ?2=1n-1n i=1(xi-x n)2=1n-1(n? i=1x2i-nx 2n) Elle possède de meilleures propriétés que la variance empirique (voir chapitreEstimation)Ecart-type corrigé

L"écart-type corrigé est défini par :

s ?=⎷s ?2 Contrairement à la variance empirique, il est exprimé dans la même unité

de mesure que le caractèreX.(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 24 / 251

Rappels de probabilités

1Introduction

2Statistique descriptive

3Rappels de probabilités

Généralités

Variables aléatoires réelles

Distributions usuelles

4Estimation

5Tests d"hypothèses

6Modèle linéaire

7Modèle linéaire généralisé

(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 25 / 251

Rappels de probabilitésGénéralités

1Introduction

2Statistique descriptive

3Rappels de probabilités

Généralités

Variables aléatoires réelles

Distributions usuelles

4Estimation

5Tests d"hypothèses

6Modèle linéaire

7Modèle linéaire généralisé

(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 26 / 251

Rappels de probabilitésGénéralités

Probabilité

Définition axiomatique (Kolmogorov-1933)

Uneprobabilitéest une applicationP: Ω→[0,1]telle que :pour toutA?Ω, on aP(A)≥0,P(Ω) =1,SiA∩B=∅, alorsP(A?B) =P(A) +P(B).Remarque

Une probabilité est une mesure.

Définition

On appeleespace probabiliséle triplet(Ω,P(Ω),P)(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 27 / 251

Rappels de probabilitésGénéralités

Probabilité

Propriétés élémentaires

i)P(A) =1-P(A) ii)P(?) =0 v)P(A?B) =P(A) +P(B)-P(A∩B)Remarque

P(A) =0ne signifie pas queAest un événement impossible.(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 28 / 251

Rappels de probabilitésGénéralités

Probabilité conditionnelle

Définition

SoitAetBdeux événements tels queP(B)?=0. Laprobabilité conditionnellede A par rapport à B, notéeP(A|B)ouPB(A)(probabilité de A sachant B), est donnée par :

P(A|B) =P(A∩B)P(B)(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 29 / 251

Rappels de probabilitésGénéralités

Formule des probabilités totales

Définition

SoitEun ensemble.A1,A2,...,Anconstituent une partition deEsi :?i? {1,...,n};Ai?=∅?i?=j;Ai∩Aj=∅A

1?A2?...?An=EFormule des probabilités totales

Si les événementsB1,B2,...,Bnforment une partition deΩ P(A) =P(B1)P(A|B1) +P(B2)P(A|B2) +...+P(Bn)P(A|Bn) n?

i=1P(Bi)P(A|Bi)(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 30 / 251

Rappels de probabilitésGénéralités

Formule de Bayes

Formule de Bayes

SiP(A)?=0etP(B)?=0alors

P(A|B) =P(A)P(B|A)P(B)Si les événementsA1,A2,...,Anforment une partition deΩalors

P(Ai|B) =P(Ai)P(B|Ai)?

ni=1P(Ai)P(B|Ai)(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 31 / 251

Rappels de probabilitésGénéralités

Exemple

Un examen systématique de dépistage est institué pour détecter une maladieM. On sait que le risque d"avoir cette maladie est de 0.001. L"examen donne des faux positifs avec probabilité 0.1 et des faux négatifs avec une probabilité de 0.3. Un individu subit un examen qui se révèle négatif. Quelle est la probabilité qu"il soit malade? (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 32 / 251

Rappels de probabilitésGénéralités

Indépendance

Définition

Deux événementsAetBsont dits indépendants si et seulement si

P(A∩B) =P(A)P(B)

On noteA??BRemarques

Si A et B sont indépendants, alors

P(A|B) =P(A)?P(B|A) =P(B)Attention à ne pas confondre indépendance et incompatibilité. (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 33 / 251 Rappels de probabilitésVariables aléatoires réelles

1Introduction

2Statistique descriptive

3Rappels de probabilités

Généralités

Variables aléatoires réelles

Distributions usuelles

4Estimation

5Tests d"hypothèses

6Modèle linéaire

7Modèle linéaire généralisé

(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 34 / 251 Rappels de probabilitésVariables aléatoires réelles

Variables aléatoires réelles

Définitions

Unevariable aléatoire réelleXest une application qui à tout

élémentωdeΩassocie un nombre réelx

X: Ω→R

ω?→xOn appelledomaine de variation(ousupport) deXl"ensemble D x?Rdes valeurs que peut prendre la variable aléatoireX.Remarques On note généralementXla variable aléatoire etxsa réalisation (c"est

à direx=X(ωi)oùωi?Ω).(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 35 / 251

Rappels de probabilitésVariables aléatoires réelles

Variables aléatoires réelles

Définition

Une variable aléatoirediscrèteest une variable aléatoire dont le domaine de variation contient un nombre fini ou une infinité dénombrable de valeurs.Une variable aléatoirecontinueest une variable aléatoire dont le domaine de variation contient une infinité non dénombrable de valeurs. (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 36 / 251 Rappels de probabilitésVariables aléatoires réelles

Loi de probabilité

Définitions

SoitXune variable aléatoirediscrètetelle queΩX=x1,...,xN. La loi de probabilité deXest définie/caractérisée par safonction de probabilitéqui donne, pour touti?1,...,N p i=P(X=xi)SoitXune variable aléatoirecontinue. On appelledensitéde probabilité la fonctionf(x)définie par : f(x) =limδ→0P(X?[x;x+δ])δ

Remarque :Pourδproche de 0,f(x)dx≈P(X?[x;x+δ])(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 37 / 251

Rappels de probabilitésVariables aléatoires réellesquotesdbs_dbs6.pdfusesText_11
[PDF] cours statistique descriptive

[PDF] cours statistique descriptive l1 eco gestion

[PDF] cours statistique l1 eco gestion

[PDF] cours statistique l1 eco gestion pdf

[PDF] cours statistique terminale bac pro

[PDF] cours statistique terminale es pdf

[PDF] cours statistique terminale s

[PDF] cours statistiques 4ème

[PDF] cours stm maroc

[PDF] cours structure de la matière 1er année st

[PDF] cours structure de la matière 1er année st pdf

[PDF] cours suite numérique terminale s

[PDF] cours suites terminale es

[PDF] cours sur l'économie sociale et solidaire

[PDF] cours sur lenvironnement ppt