• Romain Gauchon

Les modèles épidémiologiques multi-agents

Les modèles compartimentaux [1] sont simples à expliquer, faciles à mettre en place, rapides et peuvent reproduire la dynamique globale d’une épidémie. Cependant, cette simplicité a un coût : l’impossibilité d’intégrer dans le détail les aspects liés à la société et aux comportements humains. Ainsi, il leur est impossible de modéliser des clusters, des isolations pour cas contact, la présence de plusieurs variants, et rendent compliqué la prise en compte d’une diffusion géographique ou d’une politique vaccinale. Enfin, leur caractère déterministe complique l’obtention d’intervalles de confiance.


Afin de résoudre ces limites, un autre type de modèles est disponible : les modèles multi agents. Au lieu de s’intéresser à la modélisation globale d’une population, ces modèles modélisent chaque individu (ou agent) individuellement. Le modélisateur va pouvoir introduire des règles de comportement journalier, permettant à chacun d’agir (vaccination), interagir (contact prolongé), en période de pandémie. Nous évoquerons ici ces modèles, moins connus, mais offrant théoriquement des possibilités infinies.


1) En arrière-plan, un modèle compartimental


Tout d’abord, les modèles agents sont systématiquement basés sur un modèle compartimental. Ce modèle va décrire les états médicaux que peut traverser chaque agent. Chaque compartiment va ainsi être un état potentiel pour l’agent : il peut être sain, en période d’incubation, hospitalisé, etc…


De même que pour un modèle compartimental, chaque compartiment va avoir des paramètres qui lui sont propres : selon qu’il soit sain ou à l’hôpital, l’individu va être plus ou moins contagieux, avoir plus ou moins de contacts, rester dans l’état plus ou moins longtemps... Il est possible de faire varier les règles d’action en fonction de l’état. Un individu avec symptôme pourra ainsi rester chez soi et n’avoir de contact qu’avec le corps médical et sa famille. Ou, selon une probabilité fixée par le modélisateur, il pourra se rendre au travail malgré ses symptômes et potentiellement y créer un cluster.

Le temps passé dans chaque état peut être déterministe ou aléatoire. Il est alors nécessaire de définir une loi pour le temps de séjour dans chaque état lié à la maladie. Ceci est réaliste : dans le cadre du Covid, certains sont suspectés d’avoir eu une période d’incubation de plus de 20 jours ! Le choix de cette loi peut être délicat. Le temps de séjour moyen dans chaque compartiment est choisi pour être équivalent à celui du modèle compartimental sous-jacent, mais cela laisse beaucoup de souplesse. Des lois discrètes comme les lois Poisson, géométriques ou continues comme la loi de Weibull sont autant de possibilités rencontrées dans la littérature, selon l’épaisseur des queues souhaitées.


Un modèle agent est capable de refléter exactement les résultats d’un modèle compartimental. Le modèle agent offre donc de nouvelles options, théoriquement sans perte de possibilité, ce qui en fait un outil pertinent sur le papier.


2) La modélisation des contacts


Dans un modèle compartimental, le nombre de contacts journaliers est déterministe, donné par une matrice de contact. Les contacts sont supposés globalement uniformes, sans variation d’un jour à l’autre.


Deux types de modélisation peuvent être rencontrés dans les modèles compartimentaux. Certains modèles tirent les contacts dans l’ensemble de la population, quand d’autres distinguent deux types de contacts : des contacts réguliers (familles, collègues…), et des contacts occasionnels (commerçant…).


Cette seconde modélisation nécessite d’établir à l’avance un cercle de contacts réguliers pour chaque individu. On utilise alors généralement des graphes mathématiques. Ceux-ci sont en effet appropriés pour modéliser les relations humaines. Leur diversité permet de choisir différentes propriétés qui gouverneront les relations des agents entre eux. Certaines structures permettent de créer véritablement des clusters familiaux, professionnels, amicaux, etc. et de refléter la réalité.


Les contacts doivent toujours être réciproques : si A est en contact avec B, alors B est en contact avec A. Pour ce faire, il est par exemple possible de déterminer le nombre de contacts chaque jour que les individus d’une classe d’âge doivent avoir avec ceux d’une autre classe d’âge afin de respecter une matrice de contact. On tire alors au hasard un individu dans chaque classe d’âge, et on déclare ces individus comment ayant eu un contact. On répète cette opération jusqu’à avoir créé autant de contact que nécessaire. Il faut cependant prendre garde : la matrice de contact peut être modifiée par le déroulement de la maladie. Si la moitié des plus de 80 ans sont morts ou en réanimation, le nombre de contacts journaliers qu’ont les autres classes d’âge avec les plus de 80 ans sera fortement réduit.


Certaines modélisations vont encore plus loin : elles divisent chaque journée en intervalle fin (1 heure par exemple). Les types de contact vont alors dépendre de l’heure en question : à 8h, il y a des contacts dans les transports, à 16h, des contacts professionnels, à 20h, des contacts familiaux, et à minuit, il n’y a pas ou peu de contact. Il est même possible d’assigner des coordonnées géographiques à chaque agent, coordonnées qui évoluent chaque minute – un contact se produit lorsque deux agents sont au même moment aux mêmes coordonnées géographiques. Une véritable ville est alors simulée.


On peut aussi introduire ou retirer à tout moment des agents, afin de simuler des déménagements d’une ville à l’autre, par exemple.


3) La modélisation des individus


Un avantage d’une modélisation individuelle est bien sûr de pouvoir modéliser des profils d’individu différents. On l’a vu, les cercles de contacts peuvent varier d’un individu à l‘autre, mais il est possible d'aller beaucoup plus loin.


Chaque individu peut se voir attribuer un profil de santé. Par exemple, les individus en surpoids étant nettement plus vulnérables au Covid, il peut être intéressant de définir certaines personnes comme telles dans la modélisation. Il est ensuite possible de faire varier le taux de surpoids afin de comparer l’impact estimé de la pandémie entre deux populations, comme le UK et la France. Cette démarche peut aussi être menée pour les antécédents médicaux, la cigarette, etc…


Il est aussi possible de définir des critères comportementaux. La crise du Covid l’a mis en lumière : certains individus respectent mieux les règles que d’autres. Chaque individu peut être défini comme étant anti-vaccin, ne pas respecter les couvre-feux ni le port du masque, etc… Cela peut permettre de comparer les différences entre une obligation vaccinale et une vaccination volontaire par exemple.


Ces effets individuels peuvent être couplés avec les graphes de contacts. Il est réaliste de supposer que, tant pour le surpoids que sur les comportements, la sphère familiale a une forte influence, et ainsi d’augmenter les chances qu’une personne en surpoids ait des contacts avec d’autres personnes en surpoids, par exemple.


Enfin, il est possible de définir des activités pour chaque agent. Il peut être pertinent de modéliser des professeurs ayant beaucoup de contacts avec les enfants, afin d’étudier des scénarios avec ou sans fermeture des écoles. De même, définir des agents comme étant professionnels de santé, et imaginer par exemple l’impact qu’auraient leurs arrêts sur les hôpitaux peut permettre d’étudier certains scénarios très spécifiques.


4) La modélisation des politiques gouvernementales


Le principal avantage des modèles agent est la possibilité de modéliser efficacement toutes les mesures gouvernementales.


Une première mesure mise en place a été le traçage des contacts, pour chercher des clusters et ralentir l’épidémie. Un modèle agent permet de retenir la totalité des contacts qu’a eus un individu. Il est tout à fait possible, lorsqu’un individu devient positif, de remonter les contacts qu’il a eus, puis d'isoler ces individus pendant un temps. Il est aussi possible de prendre en compte le fait que l’agent infecté ne se rappelle pas forcément de tous ses contacts récents.


Une seconde mesure a été le confinement. Si le confinement peut être pris en compte dans un modèle comportemental, il n’est pas possible de définir des métiers « essentiels », comme les médecins, qui ne seraient pas soumis au confinement. Il n’est pas possible non plus de modéliser la conservation d’une structure en cluster resserré, les familles restantes entre elles, ni de modéliser les effets d’une fuite vers la campagne des populations citadines.


Une troisième mesure a consisté à fermer les lieux de loisirs et magasins non essentiels. Une modélisation agent peut simuler l’arrêt des relations mercantiles, quand un modèle compartimental se contentera de diminuer grossièrement la matrice de contact. Il est même possible de regarder l’impact en termes de manque à gagner pour ces structures, permettant la modélisation du risque de perte d’activité.


Une quatrième mesure a été la campagne de vaccination. Il est difficile de modéliser une population anti-vaccin dans un modèle compartimental. Il l’est encore plus de modéliser un pass vaccinal, avec des contacts plus fréquents des personnes vaccinés par rapport aux personnes non vaccinées. Dans un modèle compartimental, il est possible de considérer plusieurs types de vaccins simultanés, avec des stocks différés, des périodes d’immunités différentes. Tout ceci fait partie des caractéristiques de l’individu. Certes, un modèle compartimental peut modéliser certains de ces effets en ajoutant de nombreux compartiments, mais au risque de vite perdre ce qui fait son principal attrait : sa simplicité.


5) Et en pratique ?


Les options offertes par les modèles sont innombrables, mais chacune vient avec un coût de calcul important. Par exemple, intégrer le traçage des contacts oblige à mettre en place un historique de contact sur plusieurs jours. À raison de 4 contacts journaliers par individu, pour une population de 100 000 individus, cela fait 2 100 000 contacts à stocker et gérer en permanence, ce qui peut avoir un impact significatif sur la RAM.


Le nombre de simulations aléatoires requis pour chaque scénario est très élevé, puisque chaque contact, chaque transmission, chaque durée est aléatoire. De plus, le modèle étant stochastique, il demande de simuler nombreux scénarios pour avoir un résultat fiable, sinon le risque de voir l’épidémie s’éteindre en quelques jours « par chance » est trop élevé.


Il est assez délicat de paralléliser correctement un scénario, notamment pour préserver correctement le pseudo aléatoire : il ne faut pas casser la chaîne pseudo aléatoire en reproduisant plusieurs fois les mêmes valeurs sur des cœurs différents ! Il est bien sûr possible de paralléliser la simulation de plusieurs scénarios, mais cela augmente le besoin en RAM.


Les modèles les plus compliqués dépassent une heure de temps machine pour chaque scénario. La phase de calibration, qui vient en amont, augmente encore le nombre de scénarios nécessaire. Il est donc nécessaire de faire des choix et de cadrer en avance les études à effectuer, afin de rendre le modèle utilisable en pratique.


6) Conclusion


Les modèles multi-agents proposent une alternative beaucoup plus sophistiquée aux modèles compartimentaux. Ils peuvent permettre de modéliser des phénomènes impossibles à modéliser autrement, et obtenir des intervalles de confiance.


Cependant leur difficulté d’implémentation, et leurs temps d’exécution font qu’il est nécessaire de faire des concessions sur ce que l’on veut modéliser. Ainsi, lorsque l’on simule une épidémie à grande échelle, il est souvent bien plus simple, rapide, et tout aussi efficace d’utiliser un modèle compartimental.


En revanche, lorsque l’on souhaite étudier un élément précis, simuler les effets de mesures gouvernementales, ou intégrer un aléa pour estimer empiriquement des intervalles de confiance, ceux-ci se révèlent un outil bien plus approprié.


Ainsi, ils pourraient se justifier dans l’étude du risque opérationnel : leur modélisation locale peut permettre d’étudier finement l’impact d’une pandémie sur l’absentéisme dans les bureaux de la compagnie d’assurance par exemple. L’aspect stochastique par scénario rend aussi ces modèles très appropriés pour l’étude des SCR ou de l’ORSA, et permet de comprendre finement la sensibilité du bilan lors de stress tests sur le risque pandémie. L’aspect individuel permet aussi de modéliser beaucoup plus finement l’aspect coût économique de la pandémie, ce qui les rend pertinents dans des modèles de tarification / provisionnement en réassurance, et peut permettre d’estimer le coût à un ou deux ans d’une pandémie qui vient de se déclencher.


N'hésitez pas à contacter les équipes de Périclès Actuarial si vous vous demandez comment vous pourriez utiliser ces modèles au sein de votre entreprise !

[1] Voir aussi « Modèles compartimentaux et risque pandémie - gare au risque de modèle » sur le blog Périclès Actuarial

25 vues0 commentaire