Bases statistiques (pour la biologie)
18 janv. 2017 La statistique permet de répondre à de nombreuses questions ... Comptage du nombre d'événements au cours d'un intervalle de temps.
Cours de Statistiques niveau L1-L2
7 mai 2018 https://team.inria.fr/steep/files/2015/03/cours.pdf. Notes de cours d'Olivier ... Biologie médecine : essais thérapeutiques
Cours de Biostatistique
est l'application des statistiques en biologie ; sachant que la statistique est la science dont l'objet est de recueillir
Cours de Statistique
Cours de Statistique La statistique descriptive traite des propriétés des population plus que des ... Département de biologie appliquée SNV
Cours de Statistique pour Licence troisi`eme année de Biologie
1 Analyse de la variance `a un facteur - Test de comparaison de plusieurs moyennes théoriques. 5. 1.1 Mod`ele .
Statistique et biologie
Dpt de biologie La statistique permet de répondre à de nombreuses questions biologiques. Exemples ... Deux grands chapitres sont présentés dans ce cours.
Aide-mémoire de statistique appliquée à la biologie
enseigné formé et conseillé en statistique appliquée à la biologie. cours de l'expérience (i.e. population infinie ou tirages avec remise).
Résumé du Cours de Statistique Descriptive
15 déc. 2010 http://cran.r-project.org/doc/contrib/Paradis-rdebuts_fr.pdf ... statistique s'applique `a la plupart des disciplines : agronomie biologie
Méthodes statistiques appliquées à la biologie
Thèmes abordés. Ce cours aborde des méthodes d'inférence statistiques avancées pour l'analyse des données biologiques : les modèles linéaires généralisés.
MAP 574 Méthodes statistiques pour la biologie
Christophe Giraud. CMAP Ecole Polytechnique cours introductif `a la statistique. 1/103. Christophe Giraud. MAP 574 Méthodes statistiques pour la biologie
Bases statistiques (pour la biologie)
18-20 janvier 2017
Cyril Dalmasso
(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 1 / 2511Introduction
2Statistique descriptive
3Rappels de probabilités
4Estimation
5Tests d"hypothèses
6Modèle linéaire
7Modèle linéaire généralisé
(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 2 / 251Introduction
1Introduction
2Statistique descriptive
3Rappels de probabilités
4Estimation
5Tests d"hypothèses
6Modèle linéaire
7Modèle linéaire généralisé
(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 3 / 251Introduction
Exemple introductif
On s"intéresse à l"effet d"une dose faible de cambendazole sur les infections des souris par la Trichinella Spiralis... (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 4 / 251Introduction
Exemple introductif
On s"intéresse à l"effet d"une dose faible de cambendazole sur les infections des souris par la Trichinella Spiralis. 16 souris ont été infectées par un même nombre de larves de Trichinella et ensuite réparties au hasard entre deux groupes. Le premier groupe de 8 souris a reçu du cambendazole, à raison de 10 mg par kilo, 60 heures après l"infection. Les 8 autres souris n"ont pas reçu de traitement. Au bout d"une semaine, toutes les souris ont été sacrifiées et les nombres suivants de vers adultes ont été retrouvés dans les intestins :Souris non traitées5155624568714679Souris traitées4553525157516888
Que peut-on dire au sujet d"une éventuelle efficacité du cambendazole, dosé à 10mg / kg pour le traitement des infections des souris par laTrichinella Spiralis?
(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 5 / 251Introduction
Statistique et biologie
La statistique permet de répondre à de nombreuses questions biologiques.Exemples Quelle sont les valeurs normales de grandeurs biologiques (taille, poids, glycémie, ...)?Les niveaux d"expression de deux gènes sont-ils différents? Un nouveau traitement est-il plus efficace que le traitement de référence?Peut-on définir de nouvelles typologies de tumeurs?Un test de dépistage est-il fiable?
Les modifications de poids d"un individu sont-elles liées aux modifications de cholestérolémie? (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 6 / 251Introduction
Statistique
Statistique : étude de la variabilitéDéfinitions Le termestatistiqueest utilisé pour désigner trois notions distinctes :1Recueil de données2Méthodes utilisées pour analyser ces données
3Toute grandeur calculée à partir d"observations
(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 7 / 251Introduction
Statistique
Définitions
On appellestatistique descriptivel"ensemble des méthodes et techniques mathématiques permettant de représenter, de décrire et derésumer un ensemble de données.On appellestatistique inférentielle(ou inductive) l"ensemble des
méthodes visant à modéliser un ensemble de données afin de tirer des conclusions sur un ensemble plus vaste.Remarque La statistique repose sur des modèles et des hypothèses issus des probabilités. (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 8 / 251Introduction
Démarche statistique
(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 9 / 251Introduction
Statistiques et probabilités
Statistiques et probabilités sont deux aspects complémentaires de l"étude des phénomènes aléatoires (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 10 / 251Introduction
Objectifs de la formation
Donner les bases nécessaires pour :Comprendre les méthodes utiliséesSavoir interpréter des résultats
Réaliser des analyses statistiques élémentaires (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 11 / 251Statistique descriptive
Statistique descriptive
Objectif
Organiser et résumer les données afin d"en dégager les caractéristiques principales sous une forme simple et intelligibleRemarque La statistique descriptive permet notamment d"identifier des valeursextrêmes ou aberrantes et de vérifier certaines hypothèses de modélisationTypes de représentation
Tableaux
Graphiques
Indicateurs numériques
(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 12 / 251Statistique descriptive
Vocabulaire
Population: ensemble (grand, voire infini) d"individus ou d"objets demême natureEchantillon: sous ensemble de la populationCaractère / Variable: une caractéristique de la population pouvant
prendre différentes valeursModalité: toute valeur que peut prendre une variableSérie statistique: ensemble des données recueillie pour un caractère
donné à partir d"un échantillon (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 13 / 251Statistique descriptive
Types de variables
Variablequantitative: variable/caractère à laquelle on peut associerun nombrediscrète: ne peut prendre qu"un nombre fini ou dénombrable de valeurscontinue: peut prendre toutes les valeurs d"un intervalle de l"ensemble
des nombres réelsVariablequalitative: variable/caractère dont les modalités ne sontpas quantifiablesordinale: variable dont les modalités peuvent être ordonnéesnominale: variable dont les modalités ne peuvent pas être ordonnées(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 14 / 251
Statistique descriptiveIndicateurs numérique
Indicateurs numériques
Les indicateurs numériques n"ont de sens que pour des variables quantitativesIndicateurs de position ModeMoyenne empirique
Quantiles empiriques
Médiane empirique
Indicateurs de dispersion
Etendue
Intervalle interquartile
Variance empirique
(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 15 / 251Statistique descriptiveIndicateurs numérique
Indicateurs de position
Mode Pour une variable discrète, le mode est la modalitéxiayant la plus grande fréquence.Pour une variable continue, le mode est le centre de la classe ayant la plus grande fréquence.RemarqueUne variable peut avoir plusieurs modes.
(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 16 / 251Statistique descriptiveIndicateurs numérique
Indicateurs de position
Moyenne empirique
La moyenne empirique d"un échantillon est la moyenne arithmétique des observations :¯x=1n
n i=1xi(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 17 / 251
Statistique descriptiveIndicateurs numérique
Indicateurs de position
Quantiles empiriques
Le quantile empirique d"ordre1/p(oùpest un entier naturel) est la valeur ˜q1/pqui partage l"échantillon enpparties de même effectif.Quantiles particuliersMédiane empirique: quantile d"ordre1/2Quartiles: quantile d"ordrei/4Déciles: quantile d"ordrei/10Centiles: quantile d"ordrei/100(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 18 / 251
Statistique descriptiveIndicateurs numérique
Indicateurs de position
observations ordonnées.Médiane empirique La médiane empirique est le quantile d"ordre1/2:Sinest impair :˜x=x(n+12
)Sinest pair :Toute valeur comprise entrex(n2
)etx(n2+1)(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 19 / 251
Statistique descriptiveIndicateurs numérique
Indicateurs de position
Exemplevtemp
Frequency
-4-20246 0 100200
300
400
min
1er quartile
mediane moyenne3eme quartile
max(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 20 / 251
Statistique descriptiveIndicateurs numérique
Indicateurs de dispersion
Etendue
L"étendue mesure l"écart entre la plus grande et la plus petite des valeurs observées. Elle est définie par : en=max(xi)-min(xi)(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 21 / 251
Statistique descriptiveIndicateurs numérique
Indicateurs de dispersion
Distance interquartile
L"intervalle interquartilesest l"intervalle :
[˜q1/4;˜q3/4] . Il contient la moitié la plus centrale des observations.La longueur de cet intervalle q=q3-q1 est appeléedistance interquartile. Cette quantité est un indicateur de dispersion. (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 22 / 251Statistique descriptiveIndicateurs numérique
Indicateurs de dispersion
Variance empirique
La variance empirique d"un échantillon est définie par : s 2=1n n i=1(xi-x n)2=1n n i=1x2i-x 2n Elle mesure l"écart quadratique moyen de l"échantillon à sa moyenne.Ecart-typeL"écart-type est défini par :
s=⎷s 2 Contrairement à la variance empirique, il est exprimé dans la même unitéde mesure que le caractèreX.(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 23 / 251
Statistique descriptiveIndicateurs numérique
Indicateurs de dispersion
Variance empirique corrigée
La variance empirique corrigée est définie par : s ?2=1n-1n i=1(xi-x n)2=1n-1(n? i=1x2i-nx 2n) Elle possède de meilleures propriétés que la variance empirique (voir chapitreEstimation)Ecart-type corrigéL"écart-type corrigé est défini par :
s ?=⎷s ?2 Contrairement à la variance empirique, il est exprimé dans la même unitéde mesure que le caractèreX.(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 24 / 251
Rappels de probabilités
1Introduction
2Statistique descriptive
3Rappels de probabilités
Généralités
Variables aléatoires réelles
Distributions usuelles
4Estimation
5Tests d"hypothèses
6Modèle linéaire
7Modèle linéaire généralisé
(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 25 / 251Rappels de probabilitésGénéralités
1Introduction
2Statistique descriptive
3Rappels de probabilités
Généralités
Variables aléatoires réelles
Distributions usuelles
4Estimation
5Tests d"hypothèses
6Modèle linéaire
7Modèle linéaire généralisé
(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 26 / 251Rappels de probabilitésGénéralités
Probabilité
Définition axiomatique (Kolmogorov-1933)
Uneprobabilitéest une applicationP: Ω→[0,1]telle que :pour toutA?Ω, on aP(A)≥0,P(Ω) =1,SiA∩B=∅, alorsP(A?B) =P(A) +P(B).Remarque
Une probabilité est une mesure.
Définition
On appeleespace probabiliséle triplet(Ω,P(Ω),P)(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 27 / 251
Rappels de probabilitésGénéralités
Probabilité
Propriétés élémentaires
i)P(A) =1-P(A) ii)P(?) =0 v)P(A?B) =P(A) +P(B)-P(A∩B)RemarqueP(A) =0ne signifie pas queAest un événement impossible.(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 28 / 251
Rappels de probabilitésGénéralités
Probabilité conditionnelle
Définition
SoitAetBdeux événements tels queP(B)?=0. Laprobabilité conditionnellede A par rapport à B, notéeP(A|B)ouPB(A)(probabilité de A sachant B), est donnée par :P(A|B) =P(A∩B)P(B)(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 29 / 251
Rappels de probabilitésGénéralités
Formule des probabilités totales
Définition
SoitEun ensemble.A1,A2,...,Anconstituent une partition deEsi :?i? {1,...,n};Ai?=∅?i?=j;Ai∩Aj=∅A
1?A2?...?An=EFormule des probabilités totales
Si les événementsB1,B2,...,Bnforment une partition deΩ P(A) =P(B1)P(A|B1) +P(B2)P(A|B2) +...+P(Bn)P(A|Bn) n?i=1P(Bi)P(A|Bi)(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 30 / 251
Rappels de probabilitésGénéralités
Formule de Bayes
Formule de Bayes
SiP(A)?=0etP(B)?=0alors
P(A|B) =P(A)P(B|A)P(B)Si les événementsA1,A2,...,Anforment une partition deΩalorsP(Ai|B) =P(Ai)P(B|Ai)?
ni=1P(Ai)P(B|Ai)(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 31 / 251
Rappels de probabilitésGénéralités
Exemple
Un examen systématique de dépistage est institué pour détecter une maladieM. On sait que le risque d"avoir cette maladie est de 0.001. L"examen donne des faux positifs avec probabilité 0.1 et des faux négatifs avec une probabilité de 0.3. Un individu subit un examen qui se révèle négatif. Quelle est la probabilité qu"il soit malade? (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 32 / 251Rappels de probabilitésGénéralités
Indépendance
Définition
Deux événementsAetBsont dits indépendants si et seulement siP(A∩B) =P(A)P(B)
On noteA??BRemarques
Si A et B sont indépendants, alors
P(A|B) =P(A)?P(B|A) =P(B)Attention à ne pas confondre indépendance et incompatibilité. (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 33 / 251 Rappels de probabilitésVariables aléatoires réelles1Introduction
2Statistique descriptive
3Rappels de probabilités
Généralités
Variables aléatoires réelles
Distributions usuelles
4Estimation
5Tests d"hypothèses
6Modèle linéaire
7Modèle linéaire généralisé
(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 34 / 251 Rappels de probabilitésVariables aléatoires réellesVariables aléatoires réelles
Définitions
Unevariable aléatoire réelleXest une application qui à toutélémentωdeΩassocie un nombre réelx
X: Ω→R
ω?→xOn appelledomaine de variation(ousupport) deXl"ensemble D x?Rdes valeurs que peut prendre la variable aléatoireX.Remarques On note généralementXla variable aléatoire etxsa réalisation (c"està direx=X(ωi)oùωi?Ω).(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 35 / 251
Rappels de probabilitésVariables aléatoires réellesVariables aléatoires réelles
Définition
Une variable aléatoirediscrèteest une variable aléatoire dont le domaine de variation contient un nombre fini ou une infinité dénombrable de valeurs.Une variable aléatoirecontinueest une variable aléatoire dont le domaine de variation contient une infinité non dénombrable de valeurs. (Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 36 / 251 Rappels de probabilitésVariables aléatoires réellesLoi de probabilité
Définitions
SoitXune variable aléatoirediscrètetelle queΩX=x1,...,xN. La loi de probabilité deXest définie/caractérisée par safonction de probabilitéqui donne, pour touti?1,...,N p i=P(X=xi)SoitXune variable aléatoirecontinue. On appelledensitéde probabilité la fonctionf(x)définie par : f(x) =limδ→0P(X?[x;x+δ])δRemarque :Pourδproche de 0,f(x)dx≈P(X?[x;x+δ])(Université d"Evry Val d"Essonne)Bases statistiques (pour la biologie)18-20 janvier 2017 37 / 251
Rappels de probabilitésVariables aléatoires réellesquotesdbs_dbs6.pdfusesText_11[PDF] cours statistique descriptive l1 eco gestion
[PDF] cours statistique l1 eco gestion
[PDF] cours statistique l1 eco gestion pdf
[PDF] cours statistique terminale bac pro
[PDF] cours statistique terminale es pdf
[PDF] cours statistique terminale s
[PDF] cours statistiques 4ème
[PDF] cours stm maroc
[PDF] cours structure de la matière 1er année st
[PDF] cours structure de la matière 1er année st pdf
[PDF] cours suite numérique terminale s
[PDF] cours suites terminale es
[PDF] cours sur l'économie sociale et solidaire
[PDF] cours sur lenvironnement ppt