Segmenter les dynamiques de propagation du COVID-19 en France
Transformer des milliers de données épidémiques en intelligence territoriale
Entre mars 2020 et janvier 2022, la crise sanitaire liée au COVID-19 a révélé de fortes disparités dans la manière dont l’épidémie s’est propagée à travers le territoire français. Si certains départements ont été touchés dès les premières semaines, d’autres ont connu des vagues tardives mais brutales, tandis que certains semblaient relativement épargnés durant de longues périodes. Ces écarts dans les dynamiques locales de l’épidémie ont soulevé des questions majeures pour les acteurs de santé publique, notamment en ce qui concerne la répartition des ressources, la compréhension des vulnérabilités territoriales, et l’évaluation des politiques mises en œuvre.
L’analyse de données menée par l’équipe Treensight avait pour objectif de structurer ces observations, en identifiant des profils épidémiques cohérents à l’échelle départementale. L’ambition n’était pas de produire un modèle prédictif complexe, mais de construire une analyse exploratoire rigoureuse et visuelle, permettant de mieux comprendre les régularités et les anomalies dans la propagation du virus.
Un corpus de données à analyser riche et hétérogène
Le corpus mobilisé pour réaliser cette analyse de données est particulièrement riche et hétérogène. Il combine des indicateurs épidémiques tels que les taux d’incidence, les hospitalisations et la mortalité, issus de la plateforme publique data.gouv.fr, avec des variables socio-économiques comme les revenus médians ou les taux de pauvreté extraits des bases de l’INSEE, ainsi que des données relatives à la capacité hospitalière, notamment le nombre de lits disponibles et la répartition géographique des services, fournies par la DREES.
Ces données, couvrant une période de près de deux ans, ont été harmonisées temporellement afin de permettre des comparaisons robustes entre départements. Le traitement a également inclus le calcul de scores standardisés (z-scores) pour neutraliser les effets d’échelle et faciliter l’identification des dynamiques relatives.
Les résultats obtenus
L’utilisation de Treensight Explorer a permis de segmenter les départements selon leurs trajectoires épidémiques, en s’appuyant sur une exploration hiérarchique des données. Plusieurs profils ont ainsi pu être mis en évidence. Certains territoires présentaient une activité virale très intense dès les premières semaines de la pandémie, avec des pics précoces et soutenus. D’autres, au contraire, ont connu une montée en charge beaucoup plus tardive, mais avec des vagues plus marquées lors des phases ultérieures. À l’inverse, quelques départements montraient une stabilité relative ou des variations modérées, souvent associées à des facteurs géographiques, socio-démographiques ou structurels.
La visualisation proposée par Treensight a facilité l’identification de ces groupes, en les organisant de manière lisible dans des structures hiérarchiques qui permettaient à la fois une vision d’ensemble et un accès aux cas particuliers. Ce cadre d’analyse a également rendu possible la détection de points de bascule — ces moments où la situation sanitaire évolue rapidement — et la mise en lumière de territoires qui semblaient plus résilients que d’autres face aux différentes vagues épidémiques.
Apport de Treensight
L’analyse de données effectuée par Treensight a ainsi apporté une valeur ajoutée significative à cette étude exploratoire en permettant une interaction fluide avec les données. L’interface unifiée, sans rupture entre les étapes de préparation, d’exploration et d’interprétation, a permis de croiser efficacement des indicateurs de nature très différente. Les regroupements ont été construits sans codage, de façon lisible et traçable, offrant une lecture claire des dynamiques sous-jacentes. L’un des intérêts majeurs résidait dans la possibilité d’articuler les données épidémiques avec le contexte territorial, sans avoir à recourir à une modélisation complexe. En rendant visibles les contrastes, en facilitant la comparaison entre groupes de départements, et en soulignant les variables les plus discriminantes, Treensight a permis de structurer une connaissance opérationnelle sur la propagation du COVID-19. Cette étude, bien qu’exploratoire et réalisée hors d’un cadre institutionnel, illustre les capacités du logiciel à rendre intelligibles des phénomènes complexes, en appui aux démarches de veille, d’analyse ou de préparation à la décision dans le domaine de la santé publique.