[PDF] MODELISATION DE LA FREQUENCE DES SINISTRES EN





Previous PDF Next PDF



Untitled

Concrètement il s'agit de remettre un nombre important de données à département actuariel s'occupera des états SCR



MODÈLES DE DURÉE Processus poissoniens et files dattente

4 août 2021 Distribution des sauts d'un processus de Poisson . ... On considère ici un processus avec un nombre d'états fini3 égal à n



MODELISATION DE LA FREQUENCE DES SINISTRES EN

La sinistralité en assurance automobile est un problème important pour les pays industrialisés. Pour les assureurs elle se mesure en termes de fréquence des 



Méthodes de provisionnement et analyse de la solvabilité dune

Les risques techniques (risques liés au passif) sont les risques associés directement ou indirectement aux bases techniques et actuarielles de calcul des primes 



Diplôme de Statisticien Mention Actuariat

Le coût de l'aide à apporter à ces personnes peut donc se révéler très important et son financement est devenu un problème commun à l'ensemble des pays 



Comment renforcer les compagnies dassurances africaines de la

15 févr. 1995 suivies des propositions de mesures à mettre en œuvre pour lever ces ... des assurances pour tous les États membres : le Code CIMA qui est ...



État des lieux des systèmes de retraite en Afrique subsaharienne

des retraités la baisse du nombre des actifs (occasionnée par des retraité



Solvabilité 2 : Présentation générale

6 oct. 2008 Le calcul des provisions techniques diffère d'un état membre à un autre. Solvabilité 2 vise à harmoniser les règles de calcul des provisions en ...



CONSTRUCTION DE LOIS DEXPERIENCE EN PRESENCE D

justifier d'une approche marginale plus simple à mettre en œuvre en pratique. Mots-clefs : modèle multi-états



Elaboration dun zonier en assurance de véhicules par des

2 mars 2009 Pour réaliser cette tarification il convient de segmenter la zone géographique étudiée. (la France dans notre cas) en un nombre de régions2 ...

BULLETIN FRANÇAIS D'ACTUARIAT, Vol. 9, n°18, juillet - décembre 2009, pp. 41 - 63

MODELISATION DE LA FREQUENCE DES SINISTRES EN

ASSURANCE AUTOMOBILE

Olga A. VASECHKO

1

Michel GRUN-RÉHOMME

2

Noureddine BENLAGHA

3

RÉSUMÉ

La sinistralité en assurance automobile se mesure en termes de fréquence des accidents et de montant de ces accidents. Dans ce marché fortement concurrentiel,

l'assureur cherche à sélectionner des facteurs qui contribuent à expliquer la sinistralité.

Dans cet article, on s'intéresse aux facteurs explicatifs du nombre d'accidents

responsables déclarés par l'assuré à son assureur. Pour répondre à l'importance du nombre

d'assurés sans sinistre sur une période d'exercice et à l'hétérogénéité de cette population

(absence de sinistre ou sinistre non déclaré), des modèles à " inflation de zéros » sont

proposés : le modèle de Poisson et le modèle binomial négatif. A priori, ces modèles n'ont jamais été utilisés sur des données d'assurance automobile française. Nous montrons empiriquement que ces modèles sont justifiés, même si les variables explicatives de la fréquence des sinistres sont sensiblement les mêmes qu'avec les modèles classiques de comptage, à l'exception du choix de contrat et ils révèlent un effet de sélection adverse. La probabilité que l'assuré a eu un sinistre responsable non déclaré, augmente avec le coefficient réduction majoration et diminue avec l'ancienneté du véhicule et l'ancienneté de permis.

ABSTRACT

In the strongly competitive automotive insurance market, the insurer tries to determine factors that explain the frequency and cost of claims. In this paper, we study the factors that explain the number of accidents declared by the responsible insurant to his or her insurer giving consideration to the importance of the number of insurants without an accident over a given year. We use zero-inflated distributions (Poisson and binomial negative). These distributions model count data that have many zeros. For example, the 1

Research Institute of Statistics, Kyiv, Ukraine

2 Université Paris 2, ERMES-UMR7181-CNRS, Paris, France - M. GRUN-REHOMME - 3 sq. Auguste Renoir,

75014 Paris, France - E-Mail : grun@ensae.fr

3 Université Paris 2, ERMES-UMR7181-CNRS, Paris, France

42 O.A. VASECHKO - M. GRUN-REHOMME - B. BENLAGHA

zero-inflated Poisson distribution might be used when the proportion of zero counts is greater than expected on the basis of the mean of the non-zero counts. Specifically, we separate the zero accidents into two groups: those without an accident from those who had an accident but did not declare it. These models have not been used on data for the French automobile insurance market. Empirically, we show that the explanatory variables of the frequency of the disasters are appreciably the same as those with the classic models of counting, with the exception of the choice of contract for which we find adverse selection. The probability that the policyholder does not declare a claim increases with the bonus- surcharge coefficient and decreases with the age of the driver and the age of the car.

ZUSAMMENFASSUNG

Die Schadenfallsrate wird in der Autoversicherung mittels der Ausdrücke für die (Fehlen von Schadenfall oder nicht angemeldeter Schadenfall), wurden Modelle mit "Inflation von Nullen" vorgeschlagen: Poisson-Modell und negative Binomial-Modell.

Autoversicherung verwendet worden.

Wir zeigen empirisch, dass diese Modelle begründet sind, selbst wenn die für die einen gegnerischen Auswahleffekt. Die Wahrscheinlichkeit, dass der Versicherte einen nicht angemeldeten Steigerungsverminderung und vermindert sich mit dem Alter des Fahrzeuges und dem

Alter des Führerscheines.

MODELISATION DE LA FREQUENCE DES SINISTRES EN ASSURANCE AUTOMOBILE 43

1. INTRODUCTION

La sinistralité en assurance automobile est un problème important pour les pays industrialisés. Pour les assureurs, elle se mesure en termes de fréquence des accidents et de montant de ces accidents. Dans ce marché fortement concurrentiel de l'assurance automobile, qui représente la branche la plus importante de l'assurance non-vie, l'assureur cherche à déterminer des facteurs qui contribuent à expliquer la sinistralité. Ces facteurs lui permettent, en construisant des classes de risque, de segmenter son portefeuille et de hiérarchiser ces

classes à l'aide d'indicateurs de sinistralité, comme la prime pure. Cette démarche vise à

obtenir une bonne adéquation entre la sinistralité et les primes payées par les assurés. Dans cet article, on s'intéresse aux facteurs explicatifs du nombre d'accidents

responsables déclarés par l'assuré à son assureur. En général, des modèles de comptage

(modèle de Poisson ou modèle binomial négatif) sont utilisés dans la modélisation de la

fréquence des accidents. Mais du fait de l'existence, dans le portefeuille, d'un grand

nombre d'assurés sans sinistre sur une période d'exercice (une année), le nombre de zéros

de la variable aléatoire du nombre de sinistres est important. De plus, la valeur zéro peut correspondre à deux sous populations : les assurés qui n'ont eu aucun sinistre dans l'année

(cas général) et ceux qui ont eu un accident responsable et qui ne l'ont pas déclaré à

l'assureur. Non déclaration d'un accident mineur, en indemnisant directement la partie adverse pour éviter d'avoir un malus et une augmentation de sa prime. Cette non déclaration peut aussi correspondre à un délit de fuite.

Pour répondre à cette importance des valeurs nulles et à l'hétérogénéité de la

population correspondante, des modèles à " inflation de zéros » ont été proposés : le

modèle de Poisson à inflation de zéros (Zero-Inflated Poisson, noté ZIP) et le modèle binomial négatif à inflation de zéros (Zero-Inflated Negative Binomial, noté ZINB). Les variables explicatives de la fréquence des sinistres sont sensiblement les mêmes qu'avec les

modèles classiques de comptage, à l'exception du choix de contrat et ils révèlent un effet de

sélection adverse. A notre connaissance, ces modèles ont été très peu utilisés en assurance automobile.

On trouve un article de L

EE et al. (2002) sur les conducteurs novices dont l'ancienneté de permis est inférieure à un an. Ils montrent empiriquement sur des données australiennes que le modèle ZIP est justifié du fait d'une sur-dispersion de la fréquence des sinistres. M ELGAR et al. (2005) utilisent un modèle ZINB sur des données d'une compagnie

44 O.A. VASECHKO - M. GRUN-REHOMME - B. BENLAGHA

espagnole et montrent que ce modèle est plus adéquat aux données. Récemment, B

OUCHER

et al. (2007, 2008a) comparent, aussi sur des données espagnoles, les modèles à inflation de

zéros et les modèles à barrière (hurdle models), mais ils n'insistent pas sur les

interprétations des probabilités de sinistralité à l'aide des variables exogènes. Pour des

données longitudinales ou des données de panel, on peut consulter les articles de B

OUCHER

et al. (2008b) et B

OUCHER, DENUIT (2008c).

Notre démarche empirique est nouvelle dans la mesure où elle concerne des données françaises et que nous disposons du coefficient réduction majoration qui traduit l'expérience passée du conducteur. Ce texte est organisé en 5 sections. Après l'introduction, les modèles probabilistes utilisés sont exposés synthétiquement dans la section 2. Les données et quelques

statistiques exploratoires sont présentées dans la section 3. Les résultats et les comparaisons

entre les différents modèles constituent la section 4. Le papier se termine par des conclusions (section5), une bibliographie et des annexes.

2. LES MODELES

Dans la modélisation des processus de comptage, ici de la fréquence des sinistres, deux sortes de modèle sont couramment mis en oeuvre ; le modèle de poisson et le modèle binomial négatif. On trouve une littérature abondante sur l'utilisation de ces modèles : G REENE (1996), WOOLDRIDGE (1997), CAMERON et TRIVEDI (1998), WINKILMANN (2000), Y

AU et al. (2003), YANG et al. (2007).

Rappelons les définitions et les propriétés de ces modèles pour bien comprendre par la suite l'emploi des modèles ZIP et ZINB.

2.1 Modèle de Poisson

Dans un modèle de Poisson, la probabilité pour qu'une variable aléatoire Y (nombre de sinistres responsables déclarés) prennent la valeur i y (0,1,2... i y) pour un assuré i est donnée par : ii y i ii i ePY y Xy O (1) où le paramètre i dépend du vecteur i

Xdes caractéristiques (régresseurs) de

l'assuré i par une équation log linéaire, à savoir : ln , ii

Xoù est le vecteur des

coefficients à estimer. MODELISATION DE LA FREQUENCE DES SINISTRES EN ASSURANCE AUTOMOBILE 45 On vérifie aisément que dans la loi de Poisson (1), l'espérance est égale à la variance. i X ii ii i

EYX VarYX e

(2) Cette hypothèse d'équidispersion (homogénéité du portefeuille par rapport au risque) est très restrictive. Mais dans la pratique, du fait d'une abondance de valeurs nulles et de la présence de quelques valeurs extrêmes, la variance est supérieure à la moyenne. Dans ce cas, on parle d'une sur-dispersion de la variable Y. Cette situation implique une sous estimation des écarts types et on rejette trop souvent l'hypothèse nulle de non significativité des coefficients du modèle. D'où l'idée d'utiliser un modèle de comptage alternatif, basé sur la loi binomiale négative, qui prend en compte cette sur-dispersion par l'introduction d'un paramètre supplémentaire () qui permet, en outre, de capter l'hétérogénéité inobservée de la variable endogène (qui peut impliquer la sur-dispersion observée).

2.2 Modèle binomial négatif

Dans un modèle binomial négatif, on définit la probabilité pour que Y prenne la valeur i y par: (/)1 i y i i ii iii yPY y Xy (3)

En posant

1/, l'espérance et la variance s'expriment ainsi :

(/ ) , (/ ) (1 ) i X ii i ii i i

Ey X e Vary X

OODO (4)

La variance est donc différente de l'espérance et le paramètre traduit une sur dispersion (ou une sous dispersion) des données. Si

0, le modèle binomial se réduit au

modèle de Poisson. Si

0, le modèle de Poisson est rejeté au profit du modèle négatif

binomial. La sur-dispersion peut être testée soit par le ratio /( )Dnp, où D désigne la déviance, n le nombre d'observations et p le nombre de paramètres dans le modèle, soit par le ratio 2 /( )Xnp, où 2 X correspond à la statistique du chi-deux de Pearson. La déviance est définie comme 2 fois la différence entre le maximum possible de la log vraisemblance et le maximum atteint sur le modèle estimé (M

C CULLAGH, NELDER, 1989).

Le 2 Xde Pearson correspond à la somme des carrés des écarts à la moyenne. Si ces ratios sont supérieurs à 1, les données présentent une sur dispersion (et une sous dispersion si ces rations sont inférieurs à 1).

46 O.A. VASECHKO - M. GRUN-REHOMME - B. BENLAGHA

2.3 Les modèles ZIP et ZINB

CRAGG (1971) a développé différents modèles dans la situation où pour une variable endogène, un événement (comme l'achat d'un bien ou la déclaration d'un sinistre) peut se produire ou non, comme dans le modèle Tobit (T

OBIN, 1958). Si l'événement ne se produit

pas, la valeur zéro est attribuée à la variable endogène, qui est supposée continue et à

valeurs positives. Le processus de décision est représenté par un modèle probit et le second

événement (montant de l'achat ou du sinistre) par un modèle de régression standard.

En se référant à la réalité des données, il est possible que la population des assurés

pour lesquels Y=0, soit composée de deux sous populations : Une population qui prend la décision de participer à l'événement ou l'expérience, c'est-à-dire qui effectue une déclaration d'accident dans le cas où celui ci se produit. La valeur zéro indique que le conducteur assuré n'a pas eu de sinistre pendant la période considérée. Une population qui ne déclare pas un sinistre responsable à son assureur. En effet, certains assurés sont amenés à ne pas déclarer un accident sans grande gravité, pour éviter un malus et donc de payer davantage la prochaine prime. Comme les pénalités du système sont indépendantes du montant des sinistres, le conducteur responsable a tout intérêt à indemniser directement la partie adverse pour les petits sinistres. L'autre cas, concerne les conducteurs qui, par exemple, accrochent une voiture en stationnement, et ne s'arrêtent pas pour faire un constat. Cette distinction peut être intéressante pour l'assureur, car on peut penser que la non déclaration d'un sinistre responsable (en dehors des cas des délits de fuite) est liée

davantage à la non gravité du sinistre qu'à la réalité objective du risque. L'assuré ne

communique pas cette information à son assureur dans la mesure où cette démarche lui est favorable, mais ceci n'enlève rien au fait que l'assuré est risqué. Un modèle de Poisson standard ou binomial négatif ne permet pas de distinguer ces deux sous populations. Un modèle de Poisson à inflation de zéros (Zero-Inflated Poisson : ZIP) ou binomial négatif à inflation de zéros (Zero-Inflated Negative Binomial : ZINB) génère deux modèles séparés puis les combine. Ces modèles, développés par L

AMBERT

(1992) et G REENE (1994), ne supposent pas que les valeurs nulles et les valeurs strictement positives sont générées par le même processus. Par rapport aux modèles simples précédents, on suppose donc que la variable MODELISATION DE LA FREQUENCE DES SINISTRES EN ASSURANCE AUTOMOBILE 47 aléatoire observéeYest le produit d'une loi binaire B et d'une loi de Poisson (modèle

ZIP) ou binomiale négative (modèle ZINB) :

YBY (5)

La variable aléatoire inobservée

Best modélisée par une régression logistique pour estimer la probabilité que 0 i y. Pour un assuré i, 0 i b si l'assuré n'a pas déclaré d'accidents et 1 i b dans le cas contraire. La variable aléatoire

Ycorrespond au modèle

de Poisson (ou au modèle binomial négatif) et est utilisée pour prédire la valeur de

Y pour

les assurés qui ont déclaré un sinistre (1) i b. Cette équation estime l'espérance de i y. Les modèles ZIP et ZINB comportent donc deux parties : celle relative au modèle de comptage (pour Y, qui rend compte du nombre de sinistres quand l'assuré est dans la situation de déclaration) et celle relative à l'inflation de zéros (Logit) qui explique la probabilité de non déclaration. Plus précisément, pour un modèle ZIP, si on note i q la probabilité de 0 i b (pas de sinistre déclaré) et i le paramètre de la loi de Poisson pour la fréquence des sinistres, qui dépend comme précédemment des variables explicatives (4), alors la densité de la distribution Y s'écrit : (0/) (1) i ii i

PYXq qe

avec exp( )

1exp( )

i i i XqX (6) et pour i y non nulle, on a : !)1()/(quotesdbs_dbs23.pdfusesText_29
[PDF] Produire un rapport d 'activité : Pourquoi ? Comment - Enssib

[PDF] Porter un regard critique / Exercer un jugement - Éduscol - Ministère

[PDF] LES REGISTRES LITTERAIRES : DEFINITIONS Définition : le

[PDF] La relation d 'aide aux personnes en difficulté : entre - Érudit

[PDF] Le toucher dans la relation soignant-soigné - Infirmierscom

[PDF] Chapitre II) Conditions de vie et répartitions des êtres vivants - Free

[PDF] Réussite scolaire ou réussite éducative - périscope

[PDF] TUBES ACIER

[PDF] LE SANItAIRE, LE SOCIAL Et LE MÉDICO-SOCIAL - Onisep

[PDF] situation d 'apprentissage et sequence pedagogique - WikiDocs

[PDF] L approche systémique - Jamiati

[PDF] Le toucher dans la relation soignant-soigné - Infirmierscom

[PDF] SÉRIE DOCUMENTS ÉDUCATION PHYSIQUE ET SPORT - Moodle

[PDF] L 'appréhension pénale du terrorisme - Groupe ISP

[PDF] Troubles bipolaires repérage et diagnostic en premier recours - HAS