Mémoires d'Actuariat

Application de Machine Learning à l'Inventaire : Modélisation des versements dans un portefeuille d'épargne individuelle
Auteur(s) HOANG A. G.
Société Crédit Agricole Assurances
Année 2024
Confidentiel jusqu'au 28/05/2026

Résumé
Les écarts d’expérience sont un enjeu majeur en actuariat, notamment pour la production du compte de résultat. Leur réduction est essentielle pour optimiser la gestion actif/passif et les stratégies futures. L’adoption de la norme IFRS 17 par Crédit Agricole Assurances a entraîné des modifications importantes, dont la clôture des flux comptables deux mois avant la date officielle. Cette contrainte allonge la période d’estimation, rendant obsolètes les méthodes traditionnelles et générant des écarts significatifs. Ceux-ci affectent également Solvabilité II et IFRS 17, nécessitant une révision des modèles de prévision. Ce mémoire vise à modéliser les versements à court terme (deux mois) du portefeuille d’épargne individuelle via deux approches : une approche probabiliste pour les versements libres et une statistique pour les versements périodiques et initiaux. L’approche probabiliste décompose les versements en deux étapes : décision et montant. La décision est modélisée via des techniques de Machine Learning avec un prétraitement des données pour corriger le biais lié à la faible fréquence des versements. Les montants sont estimés par des modèles de régression basés sur l’historique des versements. L’approche statistique utilise des modèles ARIMA pour projeter les versements programmés et initiaux au niveau global, puis une loi de répartition basée sur des modèles de régression en Machine Learning affine ces prévisions. Testés sur un trimestre de 2023, les modèles ont donné des résultats satisfaisants, validant leur pertinence. Un plan d’action est présenté en conclusion du mémoire afin d’optimiser leur intégration dans les analyses actuarielles et de data science.

Abstract
Experience variances are a major issue in actuarial science, particularly in the production of financial statements. Reducing these variances is essential to optimizing asset/liability management and future strategies. The adoption of IFRS 17 by Crédit Agricole Assurances has introduced significant changes, notably requiring the closure of accounting flows two months before the official deadline. This constraint extends the estimation period, making traditional methods obsolete and leading to significant variances. These variances impact not only local standards but also Solvency II and IFRS 17 itself, necessitating a revision of forecasting models. This study aims to model short-term payments (over two months) for Crédit Agricole Assurances’ individual savings portfolio using two complementary approaches: a probabilistic approach for discretionary payments and a statistical approach for periodic and initial payments. The probabilistic approach decomposes payments into two steps: decision and amount. The decision is modeled using machine learning classification techniques, with data preprocessing to correct bias from the low frequency of payments. Payment amounts are estimated through regression models leveraging historical payment data. The statistical approach applies ARIMA models to project scheduled and initial payments at a global level. A distribution law, based on machine learning regression models incorporating key variables such as age and product, refines these estimates. Tested on a quarter of 2023, the models produced satisfactory results, confirming their relevance. An action plan is proposed at the end of this study to optimize their integration into actuarial and data science analyses.