Par: Justine Brooks
1 Oct, 2025
Pour de nombreuses personnes, en particulier les personnes âgées, la prise simultanée de plusieurs médicaments fait partie intégrante de leur quotidien. Cette pratique, connue sous le nom de polypharmacie, présente un danger considérable pour la patientèle, car elle peut entraîner des interactions indésirables entre les médicaments.
Audrey Durand, titulaire de chaire en IA Canada-CIFAR à Mila et professeure agrégée à l’Université Laval, applique des techniques d’apprentissage par renforcement aux données sur les soins de santé afin de déceler ces interactions dangereuses et de mettre au point un système qui pourrait automatiquement alerter le personnel en pharmacie des risques potentiels.
Le CIFAR s’est entretenu avec Audrey Durand au sujet de ses recherches, de la manière dont elles pourraient améliorer la sécurité de la patientèle, ainsi que de l’incidence de l’IA sur les soins de santé.
Audrey Durand (AD) : De grandes quantités de données ont été recueillies au fil des ans (et continuent de l’être) par le système de santé publique, qui consigne tous les médicaments prescrits aux personnes à travers le temps. Cela stimule la mise au point de modèles capables de prédire les risques liés aux associations de médicaments afin d’éviter les PPI. Cependant, calculer les risques rattachés à toutes les associations de médicaments qui apparaissent simultanément est extrêmement coûteux en temps et en ressources. De plus, comme la plupart des associations présentent un faible risque, la majorité d’entre elles ne seraient pas utiles pour entraîner un tel modèle prédictif. Notre méthode permet de sélectionner un sous-ensemble d’associations de médicaments afin de constituer efficacement un modèle prédictif.
Nous avons exploité les stratégies de bandit neuronal (un problème précis lié à l’apprentissage par renforcement) pour décider de manière séquentielle quelles associations de médicaments évaluer, c.-à-d. en calculant les risques à partir des données prérecueillies et en actualisant le modèle prédictif. Cela a permis 1) d’identifier les PPI actuellement contenues dans les données et 2) de concevoir un modèle d’apprentissage automatique capable de prédire les risques liés à toutes les associations de médicaments – même celles qui ne figurent pas dans l’ensemble de données.
AD : Nous devons souvent recourir à des simulations pour valider nos méthodes, notamment pour nous convaincre nous-mêmes et convaincre les autres que l’approche fonctionne. Nous devons mener des expériences dans un environnement contrôlé où la « vérité » est connue, afin de voir dans quelle mesure la solution peut être correctement récupérée. Les simulations sont également utiles pour caractériser les méthodes proposées, par exemple en montrant comment elles s’adaptent (efficacité de l’échantillonnage, calcul) à la complexité du problème. Cela contribue à évaluer la possibilité de la mettre en œuvre dans le monde réel.
AD : Un bon modèle prédictif de PPI pourrait aider les pharmaciens et les pharmaciennes à prendre des décisions en signalant les associations de médicaments potentiellement dangereuses. Cela pourrait contribuer à prévenir les effets indésirables découlant d’interactions inconnues ou indéterminées entre différents médicaments.
AD : En concevant nos méthodes à l’aide de simulateurs sur mesure, nous ne nous servons pas de données sensibles pendant la phase principale du projet, mais uniquement au moment du déploiement. Notre objectif est de mettre au point des méthodes générales pouvant être appliquées à divers problèmes qui présentent les mêmes défis. Le recours à un simulateur nous permet d’élaborer de telles méthodes générales plutôt que de faire mémoriser au modèle un cas d’utilisation précis (une application). Toutefois, cela nous empêche de concevoir des méthodes spécialement adaptées à ce cas d’utilisation; voilà notre compromis.
AD : Le financement accordé par le programme de chaire en IA Canada-CIFAR offre une grande liberté. Il permet à la communauté de recherche de prendre des risques calculés, ce que l’on a tendance à éviter lorsque l’on reçoit un financement conventionnel à court terme. Une telle flexibilité est particulièrement indispensable dans le cadre de collaborations multidisciplinaires. Malheureusement, bon nombre de ces approches interdisciplinaires sont mises de côté par les mécanismes de financement traditionnels. Cependant, le financement octroyé par le CIFAR soutient ce type de recherche interdisciplinaire exploratoire.
AD : Les progrès récents dans le domaine des grands modèles de langage ont favorisé le développement rapide de la prise de décision séquentielle et d’agents entièrement automatisés, y compris ceux qui apprennent en interagissant avec leur environnement. Toutefois, de nombreuses questions restent encore sans réponse quant à la manière dont les stratégies d’apprentissage interactives de ces agents peuvent s’influencer mutuellement et comment elles peuvent influencer les comportements collectifs optimaux qui peuvent être appris. Nous devrons peut-être repenser la façon dont les agents mènent leurs explorations dans de telles conditions afin d’éviter l’émergence de comportements non désirés, comme les biais et la collusion.
En ce qui concerne les applications liées à la santé, la découverte de molécules m’emballe, par exemple, la découverte de médicaments. J’estime que les méthodes dotées de capacités d’exploration intelligentes pourraient avoir des retombées considérables.
À mon avis, comprendre comment explorer efficacement et en toute sécurité des environnements complexes demeure une pièce manquante – ou du moins incomplète – du casse-tête dont il faut tenir compte pour créer des applications d’IA à la fois porteuses et sécuritaires.