Reconduction du partenariat de recherche entre l'Assurance Maladie et l'École polytechnique
La Caisse nationale de l’Assurance Maladie (Cnam) et l’École polytechnique renouvellent pour 3 ans leur convention de partenariat de recherche et développement dans le domaine des sciences des données. Débutée fin 2014, cette collaboration a abouti à de premiers résultats très prometteurs et a permis de dégager de nouvelles approches d’exploitation des données du Système national d’information inter régimes de l’Assurance Maladie (Sniiram), la base de données santé qui compile toutes les données de remboursements de soins en France.
L’objectif du partenariat est de développer différents types d’algorithmes de traitement des données, permettant notamment d’automatiser la détection de médicaments aux effets secondaires nocifs, voire graves, permettant aux autorités sanitaires d’asseoir leurs décisions sur des faits scientifiquement prouvés. Au cours des trois premières années de travaux, Emmanuel Bacry, Professeur de Mathématiques appliquées, responsable de l’initiative Data science à l’École polytechnique et Directeur de recherche au CNRS à l’Université Paris- Dauphine (CEREMADE), et son équipe du Centre de mathématiques appliquées (CMAP – École polytechnique/CNRS) ont réussi à prouver l’efficacité de leur approche visant à détecter les signaux faibles dans l’immense volume de données du Sniiram (voir encadré). Les algorithmes d’apprentissage automatique développés par les chercheurs ont en effet retrouvé l'association connue et prouvée par les méthodes classiques entre prise de pioglitazone et le déclenchement d’un cancer de la vessie chez les patients souffrant de diabète.
Détecter les effets secondaires potentiels de médicaments
Un second projet en cours de développement porte sur la prise médicamenteuse et la survenue de fractures chez les personnes âgées de plus de 65 ans. Ce projet cherchera à mettre en évidence à partir des données les sur-risques de fracture liés à la prise de médicaments identifiés comme facteur de risque de chute (anxiolytiques, sédatifs et hypnotiques, antidépresseurs, antipsychotiques, etc.).
Analyser les parcours de soins de patients
Au-delà des effets secondaires des médicaments, plusieurs approches orienteront les recherches afin d’analyser, d’identifier et de qualifier dans la masse de données différentes typologies de parcours de soins. Les chercheurs travailleront par exemple à estimer la fréquence des recours au système de santé ou décrire des pratiques cliniques et leur adéquation aux recommandations médicales. Pour ce faire, les équipes développeront des outils de visualisation et de clustering adaptés aux données volumineuses.
Identifier les mésusages et les fraudes
L'identification de situations de mésusage, voire de fraude, est indispensable à l'Assurance Maladie pour éviter les gaspillages et assurer l’utilisation légitime de ses ressources. Ce projet vise à mettre en place des procédures automatisées permettant de balayer en continu la base de données du Sniiram pour identifier les situations suspectes. Avec cette nouvelle méthode employant le Big Data, l’innovation réside dans le fait de croiser les données en recherchant des cas de fraudes sans a priori initial sur les types de médicaments, la base étant analysée dans son intégralité. Cet outil constitue un complément précieux, car économe en moyens, à la réalisation par la CNAM de travaux spécifiques destinés à documenter ces éventuels mésusages et ces fraudes.
Pour Emmanuel Bacry, responsable de l’initiative Data Science de l’École polytechnique, « l’intérêt de ce projet de recherche est de déployer, grâce à l’analyse de données massives, de nouvelles pistes permettant de répondre aux enjeux majeurs de santé publique. À terme, un de nos objectifs est par exemple de passer d’analyses ciblées et de tests individuels de médicaments à une détection automatique, simultanée et globale d’interactions nocives pour les patients ».