[PDF] estimation par noyau
[PDF] estimation par noyau d'une fonction densité
[PDF] estimation par noyau r
[PDF] estimation paramètres loi log normale
[PDF] estimation paramètres loi log normale
[PDF] estimation ponctuelle d'une proportion
[PDF] estimation probabilité exercices corrigés
[PDF] estimation spectrale non paramétrique
[PDF] estimation spectrale paramétrique
[PDF] estimation travaux en ligne
[PDF] estimation travaux maison avant achat
[PDF] estimation travaux rénovation
[PDF] estime de soi à l'école primaire
[PDF] estime de soi définition
[PDF] estime de soi exercice pratique
Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?
Estimation non paramétrique :
Quelques (bonnes?) pratiques dans l"Christophe Bontemps Toulouse School of Economics (INRA)Séminaire joint : Séminaire Statistique TSEetRéseau des Ingénieurs Statisticiens
Toulousains
13 mai 2014
Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?
PLANPourquoi ce "non"
Définition par le " non"
Estimer une densité
Des boites et des bosses
En pratique avec R
La fenêtre!
CritèresLa régression
La fenêtre!
Cas pratiques avec R
Les cas moins simples
Cas pratiques avec R
A quoi ça sert tout ça?
Estimation d"une
probabilité conditionnelle
Ajustement, prévisions et
simulations
Vous avez demandé un
test? Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?
Une définition par le "non"I
Non-paramétrique ne s"oppose pas vraiment à
paramétriqueI C"est l"objet d"intérêt quin"est pasun paramètreI On parle aussi d"estimation fonctionnelle, de paramètre fonctionnelI Une estimation non-paramétrique comporte des choix de paramètresI
9de multiples façon d"estimer non-paramétriquement!Focus sur les méthodes "à noyau"I
Beaucoup de méthodes sont programmées dansR
Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? I Soitf(Xi);i=1;:::;ng,Xiiidf(x)!Tout le monde a déjà estimé une densité non-paramétriquementI L"histogramme c"est un estimateur de la densité!I On partage le support dexen segments de largeurhet on construit des "boites" de hauteur1h d fh(x) =1n n X i=11h 1 X idans le meme segment que xI L"histogramme c"est une "somme de boites" de largeurh Demo 1 Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? I Pour l"estimation non-paramétrique de la densité :I On choisit un "noyau"i.e.une fonctionK(), par exemple :ouou bien, ou ... K(:)est une sorte de "bosse" et vérifie :RK(u)du=1;Ru K(u)du=0;etRu2K(u)du=2<1I L"estimateur à noyaude Parzen-Rosenblatt est :d fh(x) =1nh n X i=1KXixh I
Ca ressemble à l"histogramme non?d
fh(x) =1nh n X i=11 X idans le meme segment que xIPeut être vu comme une "somme de bosses" Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment ça marche? Exemple sur 10 points-2-1012 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t
Densité
Une bosse
Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment ça marche? Exemple sur 10 points-2-1012 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t
Densité
Une bosse autour de chaque point
Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment ça marche? Exemple sur 10 points-2-1012 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t
Densité
Une somme de bosses
Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment ça marche? Exemple sur 10 points-2-1012 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t
Densité
L'estimateur = somme de bosses
Bosses
Estimateur
Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?
Comment ça marche? Si j"agrandis "h"-2-1012
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t
Densité
Une somme de bosses (h=1)
Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment ça marche? Si j"agrandis "h"encore-2-1012 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t
Densité
Une somme de bosses (h=1.5)
Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?
Comment ça marche? Si je réduit "h"-2-1012
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t
Densité
Une somme de bosses (h=0.25)
Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?
Comment ça marche? En résumé-2-1012
0.0 0.4 0.8 t
Densité
h = 0.25 -2-1012 0.0 0.4 0.8 t
Densité
h = 1 -2-1012 0.0 0.4 0.8 t
Densité
h = 0.5 -2-1012 0.0 0.4 0.8 t
Densité
h = 1.5 Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?
En pratique avec R
I La commandeplot(density(x))permet de représenter graphiquement la densitéI Plusieurs packages permettent rapidement d"estimer une densitéI
KernSmooth,npI
ggplot2permet également de faire des representations (très jolies)!Focus surnpici pour des raisons explicitées plus tard. Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? I Exemple de graphique avecggplot2(fonctionqplot)0.00000
0.00005
0.00010
0.00015
0.00020
010000200003000040000
Salaires
Density
as.factor(Diplome) 1 2 3 4
Distribution des salaires par Diplome
Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?
Comment choisir sa fenêtre?
I
Visuellement ...I
Calculer un critère pour différentes valeurs dehet prendre le minimum...I
Directement avec l"erreur quadratique en un point
MSE(bfh(x)):
MSE(bfh(x)) =Eh
(bf(x)f(x))2i =Var(bfh(x))+n
Biais(bfh(x))o
2I
Mieux encore, l"IMSE(bfh) =RMSE(bfh(x))dx
1nh Z K
2(z)dz+h42
22Zf"(z)2dz
1nh 0+h42
221IEt ça c"est vachement utile!
Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?
Comment choisir sa fenêtre (suite)
I l"IMSE(bfh) =1nh 0+h42
221et donc :
sinh% 1le premier terme disparaît et sih&0; c"est le second!I La fenêtre qui minimise l"IMSE(bfh)est :hopt=cn1=5avecc=h
RK2(z)dz(
Rz2K(z)dz)2(R(f"(z))2dzi
1=5I
On a ensuite le choix :I
"Faire comme si" on connaissait2;0;et1!Règle du pouce:hRoT=1:059(x)n1=5I Estimer toutes ces choses là :Rf"(x)2dx, ... bc!Méthode dePlug-in:hPlug=bcn1=5 Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment choisir sa fenêtre (validation croisée)I On peut aussi décomposer l"ISE(bfh(x)):ISE(bfh(x)) =Z bfh(x)f(x) 2dx Z bfh(x)2dx |{z} calculable2Z bfh(x)f(x)dx |{z} E (bfh(x))+ Z f(x)2dx |{z} pas de h!I Quelques calculs plus tard... on minimise un critère empirique basé sur l"estimation de ces valeurs
CV(h) =1n
2hn X i=1n X j=1K (2)XjXih 2n n X i=1b fi h(Xi) où bfi h(Xi)=leave-one-outetK(2)(u) =RK(ut)K(t)dt.IEt la fenêtre choisiebhCV=argminhCV(h) Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?
Comment choisir sa fenêtre en pratiqueiI
Plusieurs critères :I
DansKernSmooth, on peut utiliser la commandedpik(x) pour calculer une fenêtre qui sera directement "pluggée'" dans l"estimateur .I Dansnp, on privilégie une approchedata-driven: la validation croisée.I On procédera donc toujours en deux étapes dansR:1.On estime l a(ou les) fenêtr e(s) 2. On estime l afonction (densité, r egressionou autr e)avec cette (ces) fenêtre(s)2-bisOn peut ensuite visualiser le résultat en estimant les valeurs de bfh(x))sur un ensemble de points régulièrement espacés (séquence ou grille) Demo 2 Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?
Pour la régression, on a fait le plus dur!
I
L"objet statistique à étudier est :
m(x)E(YjX=x) =Z y f(yjx)dy=Z yf(x;y)f(x)dyI
On met des chapeaux partout!
m(x) =Z y\f(x;y)d f(x)dyI
On montre que : (Estimateur de Nadaraya-Watson)
b m(x) =P n i=1YiKXixh P n i=1KXixh I
C"est une somme pondérée desYi
b m(x) =nX i=1Y iW(Xi;x;h) Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment choisir sa fenêtre pour la régression? I
Même logique, calculs différentsI
Fenêtre optimale :
h opt="quotesdbs_dbs6.pdfusesText_11