Mémoires d'Actuariat

Construction d'un véhiculier en assurance automobile
Auteur(s) GUETTOUCHE K.
Société Pacifica
Année 2025
Confidentiel jusqu'au 23/01/2027

Résumé
L’assurance automobile est un secteur qui représente une part importante du marché des assurances de biens et de responsabilité. En 2023, ce secteur a représenté 37\% du chiffre d'affaire de ce marché. En raison de la forte concurrence entre les acteurs de l’assurance, de l’évolution constante du parc automobile, de la forte inflation des coûts de réparation et des exigences réglementaires strictes, les assureurs doivent constamment innover et améliorer leurs méthodes de tarification afin de proposer des tarifs adaptés aux risques des assurés. L’une des techniques utilisées pour affiner les modèles de tarification en assurance automobile est la recherche de la meilleure segmentation du risque lié au véhicule assuré. Ce mémoire traite de la création de cette variable de risque, appelée véhiculier. Le véhiculier est une variable tarifaire qui permet d’expliquer le risque d’un véhicule en une unique variable, en classant les véhicules du plus au moins risqué selon leurs caractéristiques. Des méthodes d'apprentissage non supervisées, telles que la Classification Ascendante Hiérarchique (CAH) et l'Analyse Factorielle des Données Mixtes (AFDM), seront utilisées pour classer les véhicules en s’appuyant sur leurs caractéristiques techniques. Puis un modèle de prime pure visant à comprendre les risques de manière fine sera construit en excluant les variables liées aux véhicules. Ensuite, la sélection des variables véhicule sera optimisé en expliquant les résidus à l’aide de plusieurs modèles de machine Learning. L’utilisation de ces modèles permettra d’améliorer les modèles GLM, réputés pour leur robustesse et leur interpretabilité. Enfin l’information portée par toutes les variables véhicules sera synthétisée en une seule variable, construite à l’aide de la classification K-means.

Abstract
Car insurance represents a significant portion of the property and liability insurance market. In 2023, this sector accounted for 37\% of the market’s revenue. Due to the intense competition among insurance providers, the constant evolution of the vehicle fleet, the high inflation in repair costs and strict regulatory requirements, insurers must continuously innovate and improve their pricing methods to offer premiums that are tailored to the risks of policyholders. One of the techniques used to refine pricing models in car insurance is the search for the best segmentation of the risk associated with the insured vehicle. This thesis addresses the creation of this risk variable, called the vehicle index. The vehicle index is a pricing variable that explains the risk of a vehicle in a single variable by ranking vehicles from most to least risky based on their characteristics. Unsupervised learning methods, such as Hierarchical Cluster Analysis (HCA) and Mixed Data Factor Analysis (MDFA), will be used to classify vehicles based on their technical characteristics. Next, a pure premium model will be built to provide a fine-grained understanding of risk, excluding vehicle variables. Next, the selection of vehicle variables will be optimized by explaining the residuals using several machine learning models. The use of these models will improve the GLM models, renowned for their robustness and interpretability. Finally, the information carried by all vehicle variables will be synthesized into a single variable, constructed using K-means classification.