[PDF] [PDF] Estimation non paramétrique : Quelques (bonnes - Laurent Thibault

13 mai 2014 · Définition par le “ non” Estimer une densité Des boites et des bosses En pratique avec R La fenêtre Critères La régression La fenêtre



Previous PDF Next PDF





[PDF] Cours STAT 2150 Statistique non paramétrique: Méthodes de

Manuel de références pour le logiciel R Alternative d'une densité non paramétrique : fX(x) est Estimateur à noyau de la densité de "stock returns" avec



[PDF] Statistiques non-paramétriques : Ch 3 Économétrie non

en lissant les bords avec un “kernel smoother” ▻ Smooth : lisser ▻ Kernel est une estimation non-param de la densité f (x) d'une va x ▻ que l'on forme en de densité et probabilité Effet de la bandwidth dans un histogramme np2017 r



[PDF] Estimation non paramétrique de la densité par - Numdam

Lebesgue sur R, continue 1 Les histogrammes ou estimateurs à noyaux Leur forme la plus générale est fn(x) = Kn i(X' 



[PDF] Estimation non paramétrique : Quelques (bonnes - Laurent Thibault

13 mai 2014 · Définition par le “ non” Estimer une densité Des boites et des bosses En pratique avec R La fenêtre Critères La régression La fenêtre



[PDF] Estimation non-paramétrique dune densité - Laboratoire de

Estimation non-paramétrique d'une densité Soit K : R → R une fonction intégrable telle que ∫ K(u)du = 1 On dit qu'un noyau K est d'ordre r si : avec une loi gaussienne, un mélange de deux loi gaussiennes (c'est-à-dire une densité



[PDF] Estimation dune densité

Estimation non-paramétrique d'une densité Soit K : R → R une fonction intégrable telle que ∫ K(u)du = 1 On dit qu'un noyau K est d'ordre r si : avec une loi gaussienne, un mélange de deux loi gaussiennes (c'est-à-dire une densité



[PDF] Estimation non paramétrique de la densité de probabilité et de la

la régle de Sturges a tendance `a produire des histogrammes trop lisses R`egle de Scott [41] La valeur qui minimise l'erreur quadratique moyenne intégrée, 



[PDF] 1 Estimation de densité

non paramétrique TP 1 : Tests non paramétriques et estimation de densité Préambule : fonctions utiles • Voici le nom des principales fonctions de test sous R 

[PDF] estimation par noyau

[PDF] estimation par noyau d'une fonction densité

[PDF] estimation par noyau r

[PDF] estimation paramètres loi log normale

[PDF] estimation paramètres loi log normale

[PDF] estimation ponctuelle d'une proportion

[PDF] estimation probabilité exercices corrigés

[PDF] estimation spectrale non paramétrique

[PDF] estimation spectrale paramétrique

[PDF] estimation travaux en ligne

[PDF] estimation travaux maison avant achat

[PDF] estimation travaux rénovation

[PDF] estime de soi à l'école primaire

[PDF] estime de soi définition

[PDF] estime de soi exercice pratique

Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?

Estimation non paramétrique :

Quelques (bonnes?) pratiques dans l"Christophe Bontemps Toulouse School of Economics (INRA)Séminaire joint : Séminaire Statistique TSEetRéseau des Ingénieurs Statisticiens

Toulousains

13 mai 2014

Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?

PLANPourquoi ce "non"

Définition par le " non"

Estimer une densité

Des boites et des bosses

En pratique avec R

La fenêtre!

CritèresLa régression

La fenêtre!

Cas pratiques avec R

Les cas moins simples

Cas pratiques avec R

A quoi ça sert tout ça?

Estimation d"une

probabilité conditionnelle

Ajustement, prévisions et

simulations

Vous avez demandé un

test? Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?

Une définition par le "non"I

Non-paramétrique ne s"oppose pas vraiment à

paramétriqueI C"est l"objet d"intérêt quin"est pasun paramètreI On parle aussi d"estimation fonctionnelle, de paramètre fonctionnelI Une estimation non-paramétrique comporte des choix de paramètresI

9de multiples façon d"estimer non-paramétriquement!Focus sur les méthodes "à noyau"I

Beaucoup de méthodes sont programmées dansR

Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? I Soitf(Xi);i=1;:::;ng,Xiiidf(x)!Tout le monde a déjà estimé une densité non-paramétriquementI L"histogramme c"est un estimateur de la densité!I On partage le support dexen segments de largeurhet on construit des "boites" de hauteur1h d fh(x) =1n n X i=11h 1 X idans le meme segment que xI L"histogramme c"est une "somme de boites" de largeurh Demo 1 Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? I Pour l"estimation non-paramétrique de la densité :I On choisit un "noyau"i.e.une fonctionK(), par exemple :ouou bien, ou ... K(:)est une sorte de "bosse" et vérifie :RK(u)du=1;Ru K(u)du=0;etRu2K(u)du=2<1I L"estimateur à noyaude Parzen-Rosenblatt est :d fh(x) =1nh n X i=1KXixh I

Ca ressemble à l"histogramme non?d

fh(x) =1nh n X i=11 X idans le meme segment que xIPeut être vu comme une "somme de bosses" Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment ça marche? Exemple sur 10 points-2-1012 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t

Densité

Une bosse

Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment ça marche? Exemple sur 10 points-2-1012 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t

Densité

Une bosse autour de chaque point

Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment ça marche? Exemple sur 10 points-2-1012 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t

Densité

Une somme de bosses

Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment ça marche? Exemple sur 10 points-2-1012 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t

Densité

L'estimateur = somme de bosses

Bosses

Estimateur

Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?

Comment ça marche? Si j"agrandis "h"-2-1012

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t

Densité

Une somme de bosses (h=1)

Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment ça marche? Si j"agrandis "h"encore-2-1012 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t

Densité

Une somme de bosses (h=1.5)

Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?

Comment ça marche? Si je réduit "h"-2-1012

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 t

Densité

Une somme de bosses (h=0.25)

Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?

Comment ça marche? En résumé-2-1012

0.0 0.4 0.8 t

Densité

h = 0.25 -2-1012 0.0 0.4 0.8 t

Densité

h = 1 -2-1012 0.0 0.4 0.8 t

Densité

h = 0.5 -2-1012 0.0 0.4 0.8 t

Densité

h = 1.5 Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?

En pratique avec R

I La commandeplot(density(x))permet de représenter graphiquement la densitéI Plusieurs packages permettent rapidement d"estimer une densitéI

KernSmooth,npI

ggplot2permet également de faire des representations (très jolies)!Focus surnpici pour des raisons explicitées plus tard. Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? I Exemple de graphique avecggplot2(fonctionqplot)0.00000

0.00005

0.00010

0.00015

0.00020

010000200003000040000

Salaires

Density

as.factor(Diplome) 1 2 3 4

Distribution des salaires par Diplome

Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?

Comment choisir sa fenêtre?

I

Visuellement ...I

Calculer un critère pour différentes valeurs dehet prendre le minimum...I

Directement avec l"erreur quadratique en un point

MSE(bfh(x)):

MSE(bfh(x)) =Eh

(bf(x)f(x))2i =Var(bfh(x))+n

Biais(bfh(x))o

2I

Mieux encore, l"IMSE(bfh) =RMSE(bfh(x))dx

1nh Z K

2(z)dz+h42

22Zf"(z)2dz

1nh 0+h42

221IEt ça c"est vachement utile!

Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?

Comment choisir sa fenêtre (suite)

I l"IMSE(bfh) =1nh 0+h42

221et donc :

sinh% 1le premier terme disparaît et sih&0; c"est le second!I La fenêtre qui minimise l"IMSE(bfh)est :hopt=cn1=5avecc=h

RK2(z)dz(

Rz2K(z)dz)2(R(f"(z))2dzi

1=5I

On a ensuite le choix :I

"Faire comme si" on connaissait2;0;et1!Règle du pouce:hRoT=1:059(x)n1=5I Estimer toutes ces choses là :Rf"(x)2dx, ... bc!Méthode dePlug-in:hPlug=bcn1=5 Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment choisir sa fenêtre (validation croisée)I On peut aussi décomposer l"ISE(bfh(x)):ISE(bfh(x)) =Z bfh(x)f(x) 2dx Z bfh(x)2dx |{z} calculable2Z bfh(x)f(x)dx |{z} E (bfh(x))+ Z f(x)2dx |{z} pas de h!I Quelques calculs plus tard... on minimise un critère empirique basé sur l"estimation de ces valeurs

CV(h) =1n

2hn X i=1n X j=1K (2)XjXih 2n n X i=1b fi h(Xi) où bfi h(Xi)=leave-one-outetK(2)(u) =RK(ut)K(t)dt.IEt la fenêtre choisiebhCV=argminhCV(h) Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?

Comment choisir sa fenêtre en pratiqueiI

Plusieurs critères :I

DansKernSmooth, on peut utiliser la commandedpik(x) pour calculer une fenêtre qui sera directement "pluggée'" dans l"estimateur .I Dansnp, on privilégie une approchedata-driven: la validation croisée.I On procédera donc toujours en deux étapes dansR:1.On estime l a(ou les) fenêtr e(s) 2. On estime l afonction (densité, r egressionou autr e)avec cette (ces) fenêtre(s)2-bisOn peut ensuite visualiser le résultat en estimant les valeurs de bfh(x))sur un ensemble de points régulièrement espacés (séquence ou grille) Demo 2 Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça?

Pour la régression, on a fait le plus dur!

I

L"objet statistique à étudier est :

m(x)E(YjX=x) =Z y f(yjx)dy=Z yf(x;y)f(x)dyI

On met des chapeaux partout!

m(x) =Z y\f(x;y)d f(x)dyI

On montre que : (Estimateur de Nadaraya-Watson)

b m(x) =P n i=1YiKXixh P n i=1KXixh I

C"est une somme pondérée desYi

b m(x) =nX i=1Y iW(Xi;x;h) Pourquoi ce "non"Estimer une densitéLa fenêtre!La régressionA quoi ça sert tout ça? Comment choisir sa fenêtre pour la régression? I

Même logique, calculs différentsI

Fenêtre optimale :

h opt="quotesdbs_dbs6.pdfusesText_11