[PDF] ESTIMATION NON-PARAMETRIQUE´ DE LA FONCTION DE HASARD AVEC



Previous PDF Next PDF







ESTIMATION NON-PARAMETRIQUE´ DE LA FONCTION DE HASARD AVEC

3 Fonction de hasard et variable fonctionnelle 3 Lorsque la variable X poss`ede une densit´e f par rapport a la mesure de Lebesgue il est ais´e de voir que ce taux de hasard peut ˆetre ´ecrit (2) h(x) = f(x) S(x), pour tout x tel que F(x) < 1, ou` F d´esigne la fonction de r´epartition de X et S = 1−F la fonction de survie de X



ESTIMATION NON-PARAMETRIQUE´ DE LA FONCTION DE HASARD AVEC

a noyau de la fonction de hasard Les premiers r´esultats sur l’estimation non param´etrique de ce mod`ele, en statistique fonctionnelle, ont ´et´e obtenus par Ferraty et al [9] Ils ont ´etudi´e la convergence presque compl`ete d’un es-timateur a noyau pour la fonction de hasard d’une variable al´eatoire r´eelle



Cours 4 : Estimation non paramétrique de la loi d’une durée

Cours 4 : Estimation non paramétrique de la loi d’une durée de vie I- Généralités II- Estimation de la survie III- estimation de la fonction de hasard IV- Estimation du taux de hasard (restriction au cas censuré de type III, T et C indépendantes)



La notion de hasard : ses différentes définitions et leurs

quelqu’un ; donc sous ce rapport la chute de la pierre vient du hasard, car si elle n’était pas un hasard la chute serait le fait de quelqu’un et provoquée en vue de frapper » La pierre avait l’intention de se rendre à son lieu naturel et c’est par accident qu’elle a frappé quelqu’un Le hasard et la fortune ne sont pas de



Analyse des dur ees de vie avec le logiciel R

La fonction 0 est la fonction de hasard instantan e dite "baseline" L’ajustement d’un mod ele de r egression a hasards proportionnels sur des donn ees (i e l



Introduction à lanalyse des dur`ees de survie

3 1 onctionF de survie S La fonction de survie est, pour t xé, la probabilité de survivre jusqu'à l'instant t, c'est-à-dire S(t) = P(X>t); t>0: 3 2 onctionF de répartition F La fonction de répartition (ou c d f pour "cumulative distribution function") représente, pour t xé, la probabilité de mourir aanvt l'instant t, c'est-à-dire



Cours 3 : Probabilités

La probabilité est apparue dans les années 1600, époque où les jeux de hasard étaient très prisés Avant de faire un pari, l'aristocrate moyen voulait connaître ses chances de gagner Or, ils ne connaissaient d'autres moyens de faire ce calcul que de jouer le jeu un grand nombre de fois avec un serviteur de confiance

[PDF] exercices corrigés analyse de survie

[PDF] vision poétique de la nuit

[PDF] 144

[PDF] 8 millions en chiffre

[PDF] 4 milliards 570 million

[PDF] cent millième en chiffre

[PDF] centaine de mille

[PDF] centile exemple

[PDF] 95 percentile définition

[PDF] percentile definition

[PDF] musso pdf je reviens te chercher

[PDF] central park pdf ekladata

[PDF] synthèse anglais centrale

[PDF] centrale physique 1 pc 2012 — corrigé

[PDF] sujets centrale 2017

ESTIMATION NON-PARAM

´ETRIQUE

DE LA FONCTION DE HASARD

AVEC VARIABLE EXPLICATIVE FONCTIONNELLEFR

´ED´ERIC FERRATY, ABBES RABHI et PHILIPPE VIEU We introduce a nonparametric estimate of the conditional hazard function, when the covariate is functional. We prove consistency properties (with rates) in various situations, including censored and/or dependent variables. The rates of conver- gence emphasize the crucial role played by the small ball probabilities with respect to the distribution of the explanatory functional variable. AMS 2000 Subject Classification:62G05, 62G20, 62N02. Key words:Donn´ees censur´ees, estimation non-param´etrique, fonction de hasard conditionnelle, probabilit´es de petites boules, processusα-m´elangeant, variable fonctionnelle.

1.INTRODUCTION

L"estimation du taux de hasard, de part la vari´et´e de ses possibilit´es d"application, est une question importante en statistique. Ce sujet peut (et doit) ˆetre abord´e sous plusieurs angles selon la complexit´e du probl`eme pos´e: pr´esence ´eventuelle de censure dans l"´echantillon observ´e (ph´enom`ene courant dans les applications m´edicales par exemple), pr´esence ´eventuelle de d´epen- dance entre les variables observ´ees (ph´enom`ene courant dans les applications sismologiques ou ´econom´etriques par exemple) ou bien pr´esence de variables explicatives. De nombreuses techniques ont ´et´e ´etudi´ees dans la litt´erature pour traiter de ces diff´erentes situations mais toutes ne traitent que de variables al´eatoires explicatives r´eelles ou multi-dimensionnelles. Les progr`es techniques r´ealis´es en mati`ere de recueil et de stockage des donn´ees permettent de disposer de plus en plus souvent de donn´ees statistiques fonctionnelles: courbes, images, tableaux, ... Ces donn´ees sont mod´elis´ees comme ´etant des r´ealisations d"une variable al´eatoire prenant ses valeurs dans un espace abstrait de dimension infinie, et la communaut´e scientifique s"est naturellement int´eress´ee depuis quelques ann´ees au d´eveloppement d"outils

statistiques capables de traiter ce type d"´echantillon.REV. ROUMAINE MATH. PURES APPL.,53(2008),1, 1-18

2 Fr´ed´eric Ferraty, Abbes Rabhi et Philippe Vieu 2

Ainsi, l"estimation d"un taux de hasard en pr´esence de variable explica- tive fonctionnelle est une question d"actualit´e `a laquelle cet article propose d"apporter un premier ´el´ement de r´eponse. Apr`es un rapide survol bibli- ographique pr´esent´e au Paragraphe 2.1, le mod`ele de taux de hasard pour variable explicative fonctionnelle est pr´esent´e au Paragraphe 2.2. Les estima- teurs que nous d´efinissons sont bas´es sur les techniques de noyau de convolu- tion. Ils sont tout d"abord pr´esent´es au Paragraphe 2.3 dans le cadre classique, avant d"ˆetre g´en´eralis´es `a des variables censur´ees dans le Paragraphe 2.4. Ces estimateurs sont `a notre connaissance les premiers `a traiter de taux de hasard en pr´esence de variable fonctionnelle. Nous proposons dans cet arti- cle d"´etudier leurs comportements asymptotiques au travers de divers r´esultats de convergence presque compl`ete (avec explicitation des vitesses de conver- gence). Pour fixer les id´ees, nous commen¸cons dans le Paragraphe 3.1 par donner des r´esultats dans le cadre simple de donn´ees ind´ependantes et non censur´ees. Les extensions au cadre censur´e sont pr´esent´ees au Paragraphe 4.1. Afin de compl´eter l"´eventail de nos r´esultats, nous ´etendons ceux-ci au cadre de variables al´eatoires non n´ecessairement ind´ependantes. Plus pr´ecis´ement nous donnons dans les Paragraphes 3.2 et 4.2, des r´esultats de convergence lorsque les variables sont issues d"un processus uniform´ement fortement m´elangeant. Dans le cadre non censur´e les propri´et´es de l"estimateur de la fonction de hasard conditionnelle s"obtiennent relativement facilement `a partir de la litt´erature connue en mati`ere d"estimation de fonction de r´epartition et de densit´e conditionnelles. Ainsi, les preuves des r´esultats du Paragraphe 3 seront pr´esent´ees de mani`ere synth´etique en utilisant au maximum la litt´erature ex- istante. Par contre, dans le cadre plus int´eressant de variables censur´ees, ces propri´et´es asymptotiques ne s"obtiennent pas aussi directement, et pour am´eliorer la lisibilit´e du Paragraphe 4 les d´etails techniques des preuves qu"il contient sont report´es en fin d"article.

2.POSITION DU PROBL`EME

2.1.Le contexte bibliographique

SiXest une variable al´eatoire associ´ee `a une dur´ee de vie (c"est `a dire, une variable al´eatoire `a valeurs dansR+, le taux de hasard deX(parfois appel´e aussi fonction de hasard, taux de d´efaillance ou taux de survie) est d´efini au pointxcomme ´etant la probabilit´e instantan´ee que cette dur´ee de vie se termine `a l"instantx. Pr´ecis´ement, on a

3 Fonction de hasard et variable fonctionnelle 3

Lorsque la variableXposs`ede une densit´efpar rapport `a la mesure de Lebesgue il est ais´e de voir que ce taux de hasard peut ˆetre ´ecrit (2)h(x) =f(x)S(x), pour toutxtel queF(x)<1, o`uFd´esigne la fonction de r´epartition deXet

S= 1-Fla fonction de survie deX.

Dans de nombreuses situations pratiques, on peut disposer d"une variable explicativeZet la question devient celle de l"estimation du taux de hasard conditionnel d´efini pourx >0 par qui s"´ecrit lui aussi naturellemet `a partir de la densit´e conditionnellefZ(·) et de la fonction de r´epartition conditionnelleFZ(·) (au travers de la fonction de survie conditionnelleSZ(·) = 1-FZ(·)) deXsachantZ, sous la forme (4)hZ(x) =fZ(x)S Z(x) d`es queFZ(x)<1. L"´etude des fonctionshethZest d"un int´erˆet ´evident dans de nombreux domaines scientifiques (biologie, m´edecine, fiabilit´e, sismologie, ´econom´etrie, ...), et de nombreux auteurs se sont int´er´ess´es `a la construction d"estimateurs non-param´etriques deh. Une des techniques les plus courantes pour construire des estimateurs deh(respectivement dehZ) est bas´ee sur le r´esultat (2) (respectivement le r´esultat (4)) et consiste `a ´etudier un quotient entre un estimateur def(respectivement defZ) et un estimateur deS(respec- tivement deSZ). L"article de Patilet al.[13] fait une pr´esentation g´en´erale de ces techniques d"estimation. Les m´ethodes non-param´etriques bas´ees sur les id´ees de noyau de convolution, qui sont connues pour leur bon comportement dans les probl`emes d"estimation de densit´e (conditionnelle ou non), sont ainsi abondamment utilis´ees en estimation non-param´etrique de fonction de hasard. Un large ´eventail de la litt´erature dans ce domaine est fourni par les revues bibliographiques de Singpurwalla and Wong [15], Hassaniet al. [7], Izenman [8], Gefeller and Michels [6] et Pascu and Vaduva [12].

2.2.Hasard conditionnel pour explicative fonctionnelle

Les progr`es des proc´ed´es de recueil de donn´ees ont pour cons´equence imm´ediate d"offrir la possibilit´e aux statisticiens de disposer de plus en plus souvent d"observations de variables fonctionnelles. Les ouvrages de Ramsay and Silverman [14] et Ferraty and Vieu [5] proposent un large ´eventail de m´ethodes statistiques, param´etriques ou non, r´ecemment d´evelopp´ees pour

4 Fr´ed´eric Ferraty, Abbes Rabhi et Philippe Vieu 4

traiter divers probl`emes d"estimation dans lesquels interviennent des variables al´eatoires fonctionnelles (c"est `a dire `a valeurs dans un espace de dimension infinie). Jusqu"`a pr´esent de tels d´eveloppements statistiques pour variables fonctionnelles n"existent pas dans le contexte de l"estimation d"une fonction de hasard, et ce malgr´e le potentiel ´evident en mati`ere d"applications. L"objectif de cet article est d"´etudier un mod`ele de hasard conditionnel dans lequel la variable explicativeZn"est pas n´ecessairement r´eelle ou multi- dimensionnelle mais seulement suppos´ee ˆetre `a valeurs dans un espace abstrait Fmuni d"une semi-m´etriqued. Comme dans tout probl`eme d"estimation non- param´etrique, la dimension de l"espaceFjoue un rˆole important dans les propri´et´es de concentration de la variableX. Ainsi, lorsque cette dimension n"est pas n´ecessairement finie, les fonctions de probabilit´e de petites boules d´efinies par z(h) =P(Z?B(z,h)) =P?Z? {z?? F,d(z,z?)< h}?, interviennent de mani`ere directe dans le comportement asymptotique de tout estimateur non-param´etrique fonctionnel (voir Ferraty and Vieu [5]). Les r´esultats asymptotiques que nous pr´esentons dans la suite de cet article sur l"estimation de la fonctionhZn"´echapperont pas `a cette r`egle. Dor´enavant,zd´esigne un ´el´ement fix´e de l"espace fonctionnelF,Nz d´esigne un voisinage fix´e dezetSest un compact fix´e deR+. Nous serons amen´es `a faire l"hypoth`ese ci-dessous concernant la fonction de concentra- tionφz: (H1)?h >0, φz(h)>0. Le mod`ele non-param´etrique sur la fonctionhZ`a estimer sera d´etermin´e par des conditions de r´egularit´e portant sur la loi conditionnelle deXsachantZ.

Ces conditions sont les suivantes:

(H2)?Az<∞,?b1,b2>0,?(x1,x2)? S2,?(z1,z2)?N2z:

2.3.Construction de l"estimateur pour ´echantillon complet

qu"un couple (X,Z) o`uXest `a valeurs dansRetZ`a valeurs dans l"espace semi-m´etrique (F,d(·;·)). Dans ce paragraphe, nous nous pla¸cons dans le cas le plus simple pour lequel toutes les variablesXietZiont ´et´e observ´ees.

5 Fonction de hasard et variable fonctionnelle 5

Les avanc´ees r´ecentes en statistique non-param´etrique pour variables fonctionnelles, telles que pr´esent´ees dans Ferraty and Vieu [5], font apparaˆıtre que les techniques bas´ees sur les noyaux de convolution sont facilement trans- posables au cadre de variables fonctionnelles. Par ailleurs ces techniques `a noyau poss`edent de bonnes propri´et´es dans les probl`emes d"estimation de fonc- tion de hasard pour variables de dimension finie. Le lecteur pourra consulter le travail de Singpurwalla and Wong [15] qui est un des papiers pionniers en la mati`ere et celui de Est´evez [2] pour les r´esultats les plus r´ecents dans ce domaine. Il est donc tout naturel d"essayer de construire un estimateur de la fonc- tionhZen s"inspirant de ces id´ees. Pour estimer la fonction de r´epartition con- ditionnelle et la densit´e conditionnelle en pr´esence de variableZfonctionnelle, Ferratyet al.[4] ont propos´e les estimateurs `a noyau fonctionnels suivants: (5) ?Fz(x) =n i=1K?h-1

Kd(z,Zi)?H?h-1

H(x-Xi)?n

i=1K?h-1

Kd(z,Zi)?

et (6) ?fz(x) =n i=1K?h-1

Kd(z,Zi)?H??h-1

H(x-Xi)?h

Hn? i=1K?h-1

Kd(z,Zi)?,

o`uKest un noyau,Hune fonction de r´epartition ethK=hK,n(resp.hH= h H,n) est une suite de nombres r´eels positifs. Le bon comportement de ces estimateurs, `a la fois du point de vue asymptotique et sur le plan appliqu´e, est mis en ´evidence dans Ferraty and Vieu [5]. L"estimateur `a noyau de la fonction de hasard conditionnelle fonctionnelle h

Zpeut donc se construire de la mani`ere suivante:

(7) ?hZ(x) =?fZ(x)1-?FZ(x). Les hypoth`eses dont nous aurons besoin ult´erieurement concernant les para- m`etres de cet estimateur, c"est `a dire concernantK,H,hHethK, sont peu restrictives. En effet, d"une part elles ne sont pas propres au probl`eme d"estimation dehZ(mais plutˆot inh´erentes aux probl`emes d"estimation deFZ etfZ), et d"autre part elles correspondent aux hypoth`eses faites habituelle- ment dans le cadre de variables non fonctionnelles. Plus pr´ecis´ement, nous introduirons les conditions suivantes qui garantissent le bon comportement des estimateurs ?Fzet?fz(voir Ferraty and Vieu [5]):(H5)Le noyau cummulatifHest d´erivable et tel que

6 Fr´ed´eric Ferraty, Abbes Rabhi et Philippe Vieu 6

?est de support compact [-1,1] etH?(t)>0,?t?[-1,1].(H6)Le noyau fonctionnelKv´erifie les conditionsi)Kest `a support compact (0,1);ii)?A1,A2,?t?(0,1),0< A1< K(t)< A2<∞.(H7)La largeur de fenˆetrehKv´erifie les conditionslim

n→∞hK= 0 et limn→∞lognnh Hφx(hK)= 0.(H8)La largeur de fenˆetrehHv´erifie les conditionslim n→∞hH= 0 et?a >0,limn→∞nahH=∞. Sous ces conditions tr`es g´en´erales, nous ´etablirons dans le Paragraphe 3.1 la convergence de l"estimateur `a noyau ?hzde la fonction de hasard condi- tionnelle fonctionnellehzlorsque les couples de variables (Xi,Zi)i=1,...,nsont ind´ependants. Dans le Paragraphe 3.2, ces r´esultats seront g´en´eralis´es en s"affranchissant de la condition d"ind´ependance.

2.4.Estimation dans le cas censur´e

Dans la pratique, lors d"applications m´edicales en particulier, on peut se trouver en pr´esence de variables censur´ees. Ce probl`eme est habituellement mod´elis´e en consid´erant une variable positiveCdite de censure, et les vari- ables al´eatoires observ´ees ne sont pas les couples (Xi,Zi) mais seulement les les notationsFZ1etfZ1pour d´esigner la fonction de r´epartition et la densit´e conditionnelles deCsachantZ, et nous utiliserons la notationSZ1= 1-FZ1. De tels mod`eles `a censure ont ´et´e abondamment ´etudi´es dans la litt´erature pour des variables al´eatoires r´eelles ou multi-dimensionnelles, et dans des cadres non-param´etriques les techniques `a noyau sont particuli`erement utilis´ees (voir Tanner and Wong [16], Padgett [11], Lecoutre and Ould-Said [9] et van Keile- gom and Veraverbeke [17], pour un ´echantillon n´ecessairement non-exhaustif de la litt´erature dans ce domaine). L"objectif de ce paragraphe est d"adapter ces id´ees au cadre de variable explicativeZfonctionnelle, et de construire un estimateur de type noyau de la fonction de hasard conditionnellehZadapt´e aux ´echantillons censur´es. Si l"on introduit les notationsLZ= 1-SZ1SZet?Z=fZSZ1,on peut reformuler l"expression (4) comme (8)hZ(t) =?Z(t)1-LZ(t),?t, LZ(t)<1.

7 Fonction de hasard et variable fonctionnelle 7

On peut alors d´efinir des estimateurs des fonctions?ZetLZen posant (9) ?LZ(t) =n i=1K?h-1

Kd(z,Zi)?H?h-1

H(t-Ti)?n

i=1K?h-1

Kd(z,Zi)?

et (10)??Z(t) =n i=1K?h-1

Kd(z,Zi)?ΔiH??h-1

H(t-Ti)?h

quotesdbs_dbs22.pdfusesText_28