Mémoires d'Actuariat
Mesure de l'impact de la fiabilité des données sur un modèle de provisionnement en assurance santé collective
Auteur(s) VAUJANY P.
Société AXA France
Année 2024
Résumé
La capacité à collecter, stocker, et utiliser des données de haute qualité est essentielle pour évaluer et anticiper les risques liés au domaine de l’assurance. Ce mémoire se propose d’explorer en profondeur l’impact de la data qualité sur la performance et la justesse des modèles de provisionnement appliqués aux contrats santé collectifs. L’objectif est de mettre en lumière les défis spécifiques rencontrés dans la gestion de la donnée, ainsi que les pistes d’amélioration qui pourraient en découler. Une attention particulière sera portée à la détection de données anormales, l’idée étant de développer un modèle automatisé avec des méthodes permettant de repérer ces anomalies. En outre, il sera opportun d’identifier les phénomènes conjoncturels, tels que les pandémies, qui ne devraient pas être pris en compte lors du provisionnement. Ces approches de détection, par calculs statistiques ou par machine learning, seront testées au préalable et la plus adaptée sera retenue. Un mécanisme de lissage mathématique corrigera alors les anomalies repérées. Enfin, une application concrète sur plusieurs segments d’étude sera présentée, mettant en évidence un modèle de provisionnement appliqué aux données initiales et aux données retraitées. Le but sera d’illustrer de manière pratique les enjeux et les bénéfices ou coûts associés à l’optimisation de la qualité des données dans ce contexte spécifique. Les recherches contribueront à l’enrichissement des connaissances dans le domaine de l’actuariat en intégrant les dimensions pratiques et stratégiques liées à la fiabilisation des données. Ce travail ambitionne de démontrer comment une meilleure gestion des données peut affiner les prévisions et la robustesse des modèles actuariels, tout en offrant des perspectives concrètes d’amélioration continue dans le secteur de l’assurance.
Abstract
The ability to collect, store, and use high-quality data is essential for assessing and anticipating the risks associated with the insurance industry. This thesis aims to explore in depth the impact of data quality on the performance and accuracy of reserving models applied to group health contracts. The objective is to highlight the specific challenges encountered in data management and the potential areas of improvement that may arise. Particular attention will be given to the detection of anomalies in the data, with the aim of developing an automated model using methods to identify these anomalies. Furthermore, it will be crucial to identify cyclical phenomena, such as pandemics, which should not be considered in reserving. These detection approaches, using statistical calculations or machine learning, will be tested beforehand, and the most suitable one will be selected. A mathematical smoothing mechanism will then correct the identified anomalies. Finally, a practical application across several study segments will be presented, highlighting a reserving model applied to both the initial and reprocessed data. The goal is to provide a practical illustration of the challenges and benefits or costs associated with optimizing data quality in this specific context. The research will contribute to the enhancement of knowledge in the field of actuarial science by integrating both practical and strategic dimensions related to data reliability enhancement. This work aims to demonstrate how better data management can refine forecasts and the robustness of actuarial models, while offering concrete prospects for continuous improvement in the insurance sector.
Mémoire complet

Auteur(s) VAUJANY P.
Société AXA France
Année 2024
Résumé
La capacité à collecter, stocker, et utiliser des données de haute qualité est essentielle pour évaluer et anticiper les risques liés au domaine de l’assurance. Ce mémoire se propose d’explorer en profondeur l’impact de la data qualité sur la performance et la justesse des modèles de provisionnement appliqués aux contrats santé collectifs. L’objectif est de mettre en lumière les défis spécifiques rencontrés dans la gestion de la donnée, ainsi que les pistes d’amélioration qui pourraient en découler. Une attention particulière sera portée à la détection de données anormales, l’idée étant de développer un modèle automatisé avec des méthodes permettant de repérer ces anomalies. En outre, il sera opportun d’identifier les phénomènes conjoncturels, tels que les pandémies, qui ne devraient pas être pris en compte lors du provisionnement. Ces approches de détection, par calculs statistiques ou par machine learning, seront testées au préalable et la plus adaptée sera retenue. Un mécanisme de lissage mathématique corrigera alors les anomalies repérées. Enfin, une application concrète sur plusieurs segments d’étude sera présentée, mettant en évidence un modèle de provisionnement appliqué aux données initiales et aux données retraitées. Le but sera d’illustrer de manière pratique les enjeux et les bénéfices ou coûts associés à l’optimisation de la qualité des données dans ce contexte spécifique. Les recherches contribueront à l’enrichissement des connaissances dans le domaine de l’actuariat en intégrant les dimensions pratiques et stratégiques liées à la fiabilisation des données. Ce travail ambitionne de démontrer comment une meilleure gestion des données peut affiner les prévisions et la robustesse des modèles actuariels, tout en offrant des perspectives concrètes d’amélioration continue dans le secteur de l’assurance.
Abstract
The ability to collect, store, and use high-quality data is essential for assessing and anticipating the risks associated with the insurance industry. This thesis aims to explore in depth the impact of data quality on the performance and accuracy of reserving models applied to group health contracts. The objective is to highlight the specific challenges encountered in data management and the potential areas of improvement that may arise. Particular attention will be given to the detection of anomalies in the data, with the aim of developing an automated model using methods to identify these anomalies. Furthermore, it will be crucial to identify cyclical phenomena, such as pandemics, which should not be considered in reserving. These detection approaches, using statistical calculations or machine learning, will be tested beforehand, and the most suitable one will be selected. A mathematical smoothing mechanism will then correct the identified anomalies. Finally, a practical application across several study segments will be presented, highlighting a reserving model applied to both the initial and reprocessed data. The goal is to provide a practical illustration of the challenges and benefits or costs associated with optimizing data quality in this specific context. The research will contribute to the enhancement of knowledge in the field of actuarial science by integrating both practical and strategic dimensions related to data reliability enhancement. This work aims to demonstrate how better data management can refine forecasts and the robustness of actuarial models, while offering concrete prospects for continuous improvement in the insurance sector.
Mémoire complet
