[PDF] [PDF] Statistiques - Ajustement de courbes

1 Rappels de Statistiques 1 1 Moyenne Soit une série statistique : x1,x2,···xn ( n valeurs) Moyenne et b est donnée par l'intégrale (aire sous la courbe) :



Previous PDF Next PDF





[PDF] courbe ROC

Interprétation : AUC, l'aire sous la courbe AUC – Calcul pratique 2 – La statistique de Mann-Whitney Test de On peut en dériver un test statistique Individu



[PDF] La courbe ROC (receiver operating characteristic) : principes et

Utilisée dans de nombreux domaines médicaux, cet outil statistique est facilement Biais dans l'estimation de l'aire sous la courbe possible Pertes de données 



[PDF] Sensibilité, spécificité, courbe ROC etc - Cedric-Cnam

▫Un site: http://www anaesthetist com/mnm/stats/roc/ Page 16 16 Comparer des courbes ROC correspondant à Surface théorique sous la courbe ROC: P(X



[PDF] Statistiques - Ajustement de courbes

1 Rappels de Statistiques 1 1 Moyenne Soit une série statistique : x1,x2,···xn ( n valeurs) Moyenne et b est donnée par l'intégrale (aire sous la courbe) :



[PDF] Application des courbes ROC à lanalyse des facteurs - HUG

Analyse statistique Kaplan-Meier, modèle de Cox – 2 groupes de sujets: Cette probabilité est l'aire sous une courbe ROC, c'est un C-index • Similarité avec 

[PDF] tp physique mouvement d'un projectile

[PDF] aire sous la courbe unité

[PDF] tp mouvement d'un projectile dans un champ de pesanteur uniforme

[PDF] aire sous la courbe pharmacocinétique

[PDF] aire sous la courbe biodisponibilité

[PDF] tp chute parabolique d'une bille

[PDF] tp mouvement parabolique

[PDF] fabriquer un zootrope simple

[PDF] image zootrope

[PDF] exercice mouvement d'une particule chargée dans un champ électrique

[PDF] image pour zootrope

[PDF] exemple d'un texte narratif descriptif

[PDF] production écrite texte narratif exemple

[PDF] un texte narratif définition

[PDF] comment rédiger un texte narratif

Statistiques - Ajustement de courbes

1 Rappels de Statistiques

1.1 Moyenne, variance, écart-type

Soit une série statistique :x1;x2;xn(nvaleurs)

Moyenne

x=1n n X i=1x i Somme des carrés des écarts à la moyenne (sum of squares, SS) SS=nX i=1(xix)2

Nombre de degrés de liberté (ddl)

ddl = nombre total de valeurs - nombre de valeurs estimées Pour la somme précédente, on a estimé la moyenne, donc ddl =n- 1

Variance (estimée)

Var(x) =SSddl

=1n1n X i=1(xix)2

Ecart-type

(x) =qVar(x) 1 Figure1 - Histogramme et densité de probabilité1.2 Histogramme Si l"on dispose d"un grand nombre de valeurs on peut les regrouper en classes.

Pour chaque classe]xi;xi+1], on définit :

- l"effectifni(nombre de valeurs dans la classe) - l"amplitudeai=xi+1xi - la fréquencefi=ni=N(N = effectif total) - la densité de fréquencedi=fi=ai L"histogramme peut être tracé en portant la densité de fréquence en fonc- tion des limites de classes (Fig. 1). Dans ces conditions : - lasurfacede chaque barre est proportionnelle à la fréquence - l"unité des ordonnées est l"inverse de celle des abscisses - l"histogramme peut être approché par une courbe continue (densité de probabilité) 2

1.3 Lois de probabilités

1.3.1 Loi normale (courbe de Gauss)

Caractérisée par sa moyenneet son écart-type:N(;). La densité de probabilité est donnée par : f(x) =1 p2exp" 12 x 2# La probabilité pour que la variablexsoit comprise entre deux valeursa etbest donnée par l"intégrale (aire sous la courbe) :

Prob(a < x < b) =Z

b af(x)dx

Exemples :

Prob(2 < x < + 2)0;95

Prob(3 < x < + 3)0;99

La probabilité totale est égale à 1 :

Prob(1< x <+1) = 1

Cas particulier : loi normale réduite :N(0;1)(Fig. 1)

1.3.2 Loi de Student

Dépend du nombre de degrés de liberté (ddl) La courbe ressemble à celle de la loi normale mais d"autant plus élargie que leddlest faible (Fig. 2) Pourddl30on retrouve pratiquement la loi normale réduite.

1.3.3 Loi de Fisher-Snedecor

Correspond à la distribution d"un rapport de variances.

Caractérisée par deuxddl

La courbe est bornée à 0 et n"est pas symétrique (Fig. 3) 3 Figure2 - Loi de Student :ddl= 30 (trait plein), 5 (tirets), 2 (pointillés)-6-3036 x 0 0.1 0.2 0.3

0.4f(x)Figure3 - Loi de Fisher-Snedecor :ddl1= 10;ddl2= 5

0246
x 0 0.1 0.2 0.3 0.4 0.5 0.6

0.7f(x)4

2 Régression linéaire

2.1 Ajustement d"une droite

Le problème consiste à déterminer l"équation de la droite qui passe le plus près possible d"un ensemble de points.

Le modèle est défini par l"équation :

y=0+1x -xest la variable indépendante (ou " explicative »), supposée connue sans erreur -yest la variable dépendante (ou " expliquée »), entachée d"une erreur de mesure -0et1sont les paramètres du modèle (valeurs théoriques) Supposons que lesnpoints(x1;y1);(x2;y2);(xn;yn)soient parfaite- ment alignés (Fig. 1A), de sorte que chacun d"eux vérifie l"équation de la droite : y

1=0+1x1

y

2=0+1x2

y n=0+1xn ou, sous forme matricielle : y=X avec : y=2 6 664y
1 y 2 y n3 7

775X=2

6

6641x1

1x2 1xn3 7 775="
0 1# 5

Figure4 - Régression linéaire012345

x 0 2 4 6 8 10 12y

012345

x 0 2 4 6 8 10 12y ???(A) : Droite théorique(B) : Droite estimée

y=0+1x= 1 + 2x^y=b0+b1x= 1;2 + 1;9xEn général, les points ne sont pas parfaitement alignés (Fig. 1B), de sorte

que : y

1=0+1x1+1

y

2=0+1x2+2

y n=0+1xn+n Il y anéquations et(n+2)inconnues (0;1et lesnécartsi) : le système est donc indéterminé. On va estimer le vecteurpar un vecteurb. On aura donc une droite estimée : ^y=b0+b1x

Lesidéfinissent un vecteur de résidus :

=2 6 664
1 2 n3 7 775
6 On calculebpour quekksoit minimal (critère des moindres carrés). kk2=21+22++2n=n X i=12i=n X i=1(yi^yi)2=SSr oùSSrest lasomme des carrés des écarts résiduelle.

On montre quebest solution du système :

Ab=c avec :

A=X>X c=X>y

soit : b= (X>X)1(X>y)

2.2 Analyse de la variance

L"équation suivante est vérifiée :

SS t=SSe+SSr(1) avec : SS t=n X i=1(yiy)2SSe=n X i=1(^yiy)2SSr=n X i=1(yi^yi)2 -yest la moyenne des valeurs dey: y=1n n X i=1y i -SStest lasomme des carrés des écarts totale; elle possède(n1)degrés de liberté -SSeest lasomme des carrés des écarts expliquée; elle possède 1 degré de liberté. -SSrest lasomme des carrés des écarts résiduelle; elle possède(n2) degrés de liberté Notons que les degrés de liberté (d.d.l.) s"additionnent, tout comme les sommes de carrés d"écarts : (n1) = 1 + (n2) 7 Lesvariancess"obtiennent en divisant chaque somme de carrés d"écarts par le nombre de d.d.l. correspondants : V t=SStn1Ve=SSeVr=SSrn2 Ce sont respectivement les variances totale, expliquée, et résiduelle. (Ces variances ne s"additionnent pas!)

On en déduit les quantités suivantes :

- lecoefficient de déterminationr2 r

2=SSeSS

t r

2représente le pourcentage des variations deyqui est " expliqué »

par la variable indépendante. Il est toujours compris entre 0 et 1. Une valeur de 1 indiquerait un ajustement parfait. - lecoefficient de corrélationr C"est la racine carrée du coefficient de détermination, affecté du signe de la penteb1. Il est toujours compris entre -1 et 1. - l"écart-type résiduelsr C"est la racine carrée de la variance résiduelle (sr=pV r). C"est une estimation de l"erreur faite sur la mesure de la variable dépendantey. Une valeur de 0 indiquerait un ajustement parfait. - lerapport de varianceF C"est le rapport de la variance expliquée à la variance résiduelle (F= V e=Vr). Il serait infini dans le cas d"un ajustement parfait.

2.3 Précision des paramètres

La matrice :

V=VrA1=Vr(X>X)1

est appeléematrice de variance-covariancedes paramètres. C"est une matrice symétrique dont la structure est la suivante :

V="Var(b0) Cov(b0;b1)

Cov(b0;b1) Var(b1)#

Les termes diagonaux sont les variances des paramètres, à partir des- quelles on calcule les écart-types : s

0=qVar(b0)s1=qVar(b1)

8 Le terme non-diagonal est la covariance des deux paramètres, d"où l"on tire le coefficient de corrélationr01: r

01=Cov(b0;b1)s

0s1

2.3.1 Présentation des résultats

Les résultats sont habituellement présentés sous la forme : y= (b0s0) + (b1s1)x Les écart-types sont donnés avec 1 ou 2 chiffres significatifs. Chaque pa- ramètre est donné avec autant de décimales que son écart-type. Rappel : les chiffres significatifs sont comptés à partir du premier chiffre non nul. (Ex. : 1,2340,012 ou 1,230,01)

2.4 Interprétation probabiliste

On suppose que les résidusi= (yi^yi)sont identiquement et indépen- demment distribués selon une distribution normale de moyenne 0 et d"écart- type(estimé parsr). On montre alors que les paramètres(b0;b1)sont distribués selon une loi de Student à(n2)d.d.l. On peut dès lors calculer un intervalle de confiance pour chaque para- mètre, par exemple : hb

0t1=2s0; b0+t1=2s0i

oùt1=2est la valeur de la variable de Student correspondant à la probabilité choisie (habituellement= 0;05). Cet intervalle a une probabilité(1) de contenir la valeur théorique0. On peut aussi calculer une valeur " critique »F1à partir de la dis- tribution de Fisher-Snedecor à 1 et(n2)d.d.l. L"ajustement peut être considéré comme satisfaisant si le rapport de varianceFexcède 4 fois cette valeur critique.

Note: pour une droite de régression,F1=t

1=2 2 9

2.5 Tests d"hypothèses

- On pose unehypothèse nulle(H0) concernant la droite théorique - On calcule, sousH0, la probabilitéd"obtenir les paramètres observés - Si cette probabilité est suffisamment faible, on rejetteH0au rique

2.5.1 Test de l"ordonnée à l"origine

H

0:0= 0(la droite théorique passe par l"origine)

SousH0, la variable :

b ?0=b00s 0=b0s 0 suit une loi de Student à(n2)d.d.l. On calcule, sousH0; = Prob(jTjb?0),Tétant la variable de Student.

2.5.2 Test de la pente

H

0:1= 0(la droite théorique est horizontale :yne dépend pas dex)

SousH0, la variable :

b ?1=b11s 1=b1s 1 suit une loi de Student à(n2)d.d.l. On calcule, sousH0; = Prob(jTjb?1),Tétant la variable de Student.

2.5.3 Test de F

H

0:Ve=Vr()F= 1

SousH0; Fsuit une loi de Fisher-Snedecor à 1 et(n2)d.d.l.

On calcule, sousH0; = Prob(FFobs)

3 Régression multilinéaire

3.1 Equations normales

Le modèle de régression est :

y=0+1x1+2x2+ 10 où lesxisontmvariables (en principe indépendantes).quotesdbs_dbs35.pdfusesText_40