• Bennis Amine

Assurance auto : Alternative aux méthodes classiques de tarification de type GLM

Mis à jour : mars 22

Introduction :


L’objectif de cet article est de présenter la mise en place de la tarification d’un produit en Assurance Auto spécifique à des véhicules d’occasion dans le cadre d’une modélisation « coût moyen / fréquence ». Dans l'illustration qui suit, nous disposons d’une base de données regroupant des véhicules avec au moins 5 ans d’ancienneté scindée en deux parties distinctes :

  1. Une base image regroupant tous les contrats constituant notre portefeuille

  2. Une base sinistre regroupant tous les cas de sinistres déclarés

Après étude de ces bases de données, nous avons constaté que la modélisation de la fréquence se fait au travers de la base image, qui est suffisamment dense pour réaliser une modélisation robuste à l’aide d’un GLM. D’un autre côté, le volume des sinistres dans le cas des garanties dommages n’était pas suffisant pour mettre en place un modèle robuste pour l’estimation du coût moyen à l’aide des méthodes classiques de type modèles généralisés de régression linéaire (GLM).


Cet article a ainsi pour but de présenter une alternative à ces méthodes classiques pour la modélisation du coût moyen d’un sinistre, dans le cas des garanties dommages.


L’idée consiste à ne plus dépendre uniquement d'une base sinistre, en utilisant les sites de cotations en ligne, spécialistes dans l’estimation des prix des véhicules d’occasion. Une cotation consiste à renseigner les informations précises sur la nature de véhicule, de façon à obtenir une estimation de sa valeur.

Cette estimation nécessite un traitement supplémentaire au préalable de la base de données. Certaines informations importantes pour la cotation peuvent être retrouvées en complétant la base avec les informations mises à disposition par la SRA ("Sécurité et Réparation Automobile", association française regroupant les sociétés et mutuelles d'assurance automobile et chargée d'études techniques et de statistiques). D’autres informations comme « le nombre de kilomètres parcourus » ne sont quant à elles pas à disposition, il est alors nécessaire de mettre en place une méthode pour estimer cette variable.


Contexte :


La mise en place d’un tarif en assurance IARD repose le plus souvent sur l’analyse de la prime pure dans le cadre d’une modélisation « coût moyen /fréquence » à travers des modèles généralisés de régression linéaire (GLM). La qualité ainsi que la quantité des données utilisées jouent un rôle important pour la robustesse des modèles.

La modélisation de la « fréquence » se fait à travers une base de données qui reprend tous les contrats qui ont vécu dans le portefeuille ainsi qu’un compteur de sinistre pour chaque garantie. La modélisation du « coût moyen » se fait cette fois-ci à travers une base sinistre. Cette base doit détailler l’ensemble des informations sur les sinistres (coût, franchise appliquée, date de survenance, informations véhicule et conducteur).

Ce besoin de qualité sur les données est encore plus important en ce qui concerne la base sinistre, d’autant plus que la base est scindée au minimum en 4 groupes distincts, les sinistres concernés par :

  1. La garantie responsabilité civile « RC »

  2. La garantie Bris de glace « BDG »

  3. Les garanties vol et incendie « VOL/INC »

  4. La garantie dommage tout accident « DTA »


Les garanties dommages « VOL/INC » et « DTA » correspondent aux garanties dont le volume de sinistres est le plus faible. Par conséquence la base sinistre pour ces garanties se retrouve moins dense et donc la modélisation associée moins pertinente.

Nous avons donc réfléchi à une alternative, dans le cas où la base sinistre n’est pas assez volumineuse pour l’estimation du coût moyen, pour le cas spécifique des garanties dommages. Que ce soit pour les garanties « VOL/INC » ou la garantie « DTA », la valeur du véhicule joue un rôle primordial dans l’évaluation du coût du sinistre au moment des faits.

L’évaluation de la valeur d’un véhicule est d’autant plus juste lorsque la liste des informations sur ce dernier est complète (modèle/marque finition exacte, boite de vitesse, carburant, kms parcourus …). L’idée est donc d’exploiter ces estimations pour aboutir à une nouvelle tarification du coût des garanties dommages.

La méthode présentée ici se fera en deux étapes distinctes :

  1. La première étape consiste à estimer la valeur des véhicules, du portefeuille et de la base sinistre, pour l’année en cours.

  2. La seconde étape consiste à estimer le taux de destruction, soit le pourcentage de dommages subis par le véhicules par rapport à sa valeur actuelle.


Sur la base de cette méthode, la prime pure se calculera de la manière suivante à la souscription :


Principaux critères retenus :


Groupe SRA : Un des principaux indicateurs utilisés en tarification provenant de la base nationale SRA « Sécurité et Réparation Automobile ». Noté de 20 à 50, le groupe représente la puissance, mais également la dangerosité du véhicule


Classe SRA : Un des principaux indicateurs utilisés en tarification provenant de la base nationale SRA « Sécurité et Réparation Automobile ». Notée de A à V, est souvent associée à la classe de prix du véhicule


Formule de garantie : On distingue dans notre base de données 4 formules distinctes :

  1. F1 = RC seule ;

  2. F2 = F1 + BDG ;

  3. F3 = F2 + VOL + INC;

  4. F4 = F3 + DTA


Niveau de franchise : Représente la somme restant à la charge de l’assuré pour couvrir les réparations du véhicule en cas d’accident. Suivant le produit sélectionné, une grille déterminant le niveau de franchise est en place en fonction de groupe et de la classe SRA


Caractéristique du conducteur : L’ensemble des informations disponibles sur le conducteur : CRM (coefficient bonus-malus), Age, Profession, code postal …


Stationnement : On distingue dans notre base de données 2 modalités distinctes :

  1. Stationnement fermé ;

  2. Stationnement ouvert


Caractéristique véhicule : L’ensemble des informations essentielles pour mener à bien un devis : marque, modèle, Finition, Puissance, année de mise en circulation, kms parcourus …


Estimation de la valeur du véhicule :


Certaines informations peuvent être complétées en croisant notre base de données avec la base SRA, « Sécurité et Réparation Automobile » qui est une association française regroupant les sociétés et mutuelles d'assurance automobile et chargée d'études techniques et de statistiques.

D’autres informations essentielles à l’évaluation de la cotation sont quant à elles plus compliquées à obtenir, comme par exemple le nombre de kms parcourus.

Cette variable est assez importante étant donné qu’elle a un impact important sur la valeur finale d’un véhicule. Il est donc nécessaire de définir des critères et une méthode pour estimer une valeur approchée.

Dans ce cas précis, nous avons fait le choix d’estimer le nombre de kms parcourus selon 3 critères :

  1. La densité géographique de la ville d’immatriculation du véhicule ;

  2. Le type d’usage (véhicule particulier ou utilitaire) ;

  3. Le type de carburant

Exemple : résultat d’une étude sur le type de carburant pour les véhicules particuliers



Chaque modalité, pour ces 3 critères, est associée à une estimation du nombre de kms parcourus par an. L’approximation pour chaque véhicule du portefeuille correspondra donc à une moyenne des estimations faites sur la base de ces 3 critères.



Estimation du taux de destruction :


On définit le taux de destruction comme étant le rapport entre le montant réglé observé lors d’un sinistre et l’estimation de la cote marché du véhicule.

Par définition le taux de destruction doit être compris entre 0% et 100% :

  • Lorsque α < 100 % on se situe dans le cas d’une destruction partielle du véhicule

  • Lorsque α = 100 % on se situe dans le cas d’une destruction totale du véhicule


Il faut néanmoins prendre en compte un aspect important et distinguer 2 types de sinistres :

- Les sinistres dont le coût est inférieur à la valeur du véhicule, le règlement du sinistre se fait normalement par l’assureur.

- Les sinistres dont le coût est supérieur à la valeur du véhicule, on entre dans le cas d’un VEI (véhicule économiquement irréparable). Dans ce cas l’assureur propose une indemnisation en perte totale avec cession du véhicule accidenté par l’assuré.


On part donc du principe qu’un sinistre ne peut pas dépasser en montant la valeur estimée du véhicule et que lorsque l’on se retrouve dans le cas d’un VEI c’est bien le cas « α = 100 % » qui est retenu pour notre base sinistre.

Une fois ce taux de destruction calculé pour chaque sinistre, il sera possible de construire la distribution des taux de destruction pour les garanties VOL/INC et DTA. La distribution du taux de destruction d’un véhicule va fortement dépendre de sa valeur. Lors d’un sinistre, un véhicule estimé à 4000 € aura une probabilité plus élevée de se retrouver dans le cas de perte totale qu’un véhicule estimé à 8000 €.



Actualisation de la prévision des coûts des sinistres :


En plus du biais qui peut survenir lors d’une modélisation classique des garanties dommages, l’évolution de la tarification dans le temps pour un contrat en portefeuille ne reflète pas la réalité de l’évolution du bien assuré. Des revalorisations tarifaires globales sont généralement effectuées en fonction de la sinistralité de l’assureur sur l’ensemble des polices.

La construction de courbes de décotes va permettre de prévoir l’évolution future des sinistres automobiles pour les garanties dommages. Les modèles tarifaires vont évoluer de la façon suivante :


Conclusion :


Dans le cas où l’on dispose d'une base de sinistre suffisamment dense et volumineuse, la méthode classique de tarification permet une estimation assez précise du tarif pour l’année N. La méthode présentée dans cet article correspond à une réflexion sur une méthode de substitution, lorsque ces données sont insuffisantes et la modélisation par les GLMs impossible. Le volume de données nécessaires est moins important mais la contrainte sur le niveau de détail pour chaque véhicule est plus important et doit correspondre à celui demandé par le site de cotation sélectionné.

L’intérêt qu’apporte cette méthode réside dans l’actualisation du tarif les années suivantes. Les approches classiques consistent soit à appliquer un taux de revalorisation global au portefeuille, choisi en fonction du ratio S/P du portefeuille, soit à refaire la même modélisation l’année suivante avec les informations supplémentaires récoltées. Dans le cas de la méthode présentée ici, la revalorisation se fait de manière individuelle et en fonction des spécificités du véhicule ainsi que l’évolution des différents coûts de réparation.




Rédacteur : Amine BENNIS