En juillet 2020, des membres du programme Extrême Univers et gravité (EUG) du CIFAR ont rencontré des titulaires de chaire en IA Canada-CIFAR (IACC) et d’autres spécialistes de l’intelligence artificielle (IA) et de la biomédecine dans le cadre d’une table ronde virtuelle afin d’explorer l’application des algorithmes mis au point et utilisés pour l’analyse de données astronomiques et cosmologiques à des problèmes tout aussi complexes en biomédecine, et vice versa. Cette table ronde a contribué au lancement de nouvelles collaborations de recherche interdisciplinaires fructueuses.
Le 3 juin 2022, dans la foulée de ces travaux antérieurs, le CIFAR a organisé un atelier d’un jour qui a permis d’élargir la conversation entre les astronomes/cosmologues et les spécialistes de l’IA. Les membres du programme EUG, des titulaires de chaire IACC et d’autres spécialistes de l’astronomie et de l’IA du milieu universitaire et de l’industrie se sont réunis en tables rondes et en groupes de discussion pour s’entretenir de méthodes nouvelles et optimisées d’exploitation de l’intelligence artificielle et de l’apprentissage automatique (AA) en astronomie et en cosmologie, ainsi que de possibilités d’application des concepts et des techniques de la physique et de l’astronomie aux fondements théoriques de l’IA et de l’AA. Les personnes présentes ont aussi partagé leurs points de vue sur les opportunités et les défis communs aux deux domaines, ouvrant ainsi la voie à de nouvelles possibilités de collaboration.
Résultats et priorités clés
- Bien que d’ici dix ans le gros de l’analyse de données en astronomie et en cosmologie pourrait faire appel à l’AA, les astronomes doivent soigneusement examiner les avantages d’une telle démarche. Essentiellement, l’AA est une fonction d’ajustement très puissante qu’il est possible d’entraîner pour s’ajuster à toute donnée. Appliquer l’AA à un nouveau problème simplement parce que c’est possible n’est pas nécessairement un exercice intéressant sur le plan scientifique, et il pourrait être difficile pour les spécialistes d’évaluer si l’ajustement généré est vraiment bon.
- L’AA est le plus utile dans les cas où il apporte des avantages spécifiques à la réalisation d’un objectif scientifique, par exemple lorsqu’il permet d’accélérer considérablement le processus par rapport aux méthodes statistiques traditionnelles, d’améliorer l’exactitude (en apprenant des distributions de probabilités a priori complexes et en évitant les biais cumulés; sans AA, il faut commencer avec des a priori plus simples et plus d’approximations dans les modèles, ce qui peut fausser les résultats) et d’obtenir de nouvelles informations physiques à partir des données (par exemple en utilisant des méthodes de régression symbolique pour obtenir de nouvelles équations analytiques).
- L’une des applications les plus puissantes de l’AA en astronomie/cosmologie concerne l’inférence de paramètres astrophysiques et cosmologiques. Les techniques basées sur l’AA permettent de produire des prédictions théoriques à mettre en correspondance avec les données observées (par exemple, l’utilisation de réseaux neuronaux convolutifs pour produire des modèles plus généraux que les simulations hydrodynamiques, à plus faible coût de calcul), d’inférer des paramètres à partir de données (par exemple, l’utilisation d’un estimateur par transformée de diffusion en ondelettes qui exploite plus pleinement toute l’information contenue dans les données tout en maintenant l’interprétabilité), et la détermination de la vraisemblance des données observées compte tenu des paramètres déduits (par exemple, l’utilisation de modèles génératifs basés sur le flot qui intègrent les symétries de translation et de rotation, ou de modèles qui peuvent saisir la non-gaussianité des données).
- L’une des principales raisons d’utiliser l’AA dans l’inférence des paramètres est l’exactitude des estimations de l’incertitude qui est influencée par une combinaison de bruit dans les données d’origine et d’erreurs générées par le réseau neuronal lui-même. La communauté de recherche devra définir le niveau d’exactitude nécessaire pour ces estimations. Les méthodes qui associent la simulation et l’AA (notamment les réseaux neuronaux bayésiens et les réseaux de densité de mélange) pourraient améliorer l’exactitude des estimations d’incertitude.
- Les scientifiques qui mettent au point des techniques d’AA pour l’astronomie et la cosmologie devraient viser des techniques et des flux de travail reproductibles, explicables et interprétables (comme la régression symbolique ou la transformée de diffusion en ondelettes), en minimisant l’augmentation des données et en misant plutôt sur des architectures qui codent les symétries physiques attendues des problèmes d’intérêt, afin de mettre en correspondance les modèles avec un ensemble existant de connaissances scientifiques et de permettre une certaine compréhension des caractéristiques des données qui ont permis l’apprentissage. La communauté devrait définir une forme de référence ou de norme en vue de comparer les performances et d’aider les spécialistes à évaluer la fiabilité des modèles.
- La cosmologie et l’astrophysique, et plus généralement la physique, peuvent contribuer au développement de l’AA de plusieurs façons importantes. Par exemple, la génération de données synthétiques pour les simulations se fait couramment dans la recherche en (astro)physique, de sorte que les modèles utilisés en physique pour la génération de données pourraient aider à comprendre comment la distribution et les caractéristiques des données influencent l’apprentissage des modèles d’AA. Les spécialistes de l’AA pourraient aussi s’inspirer de la modélisation de la dynamique de l’environnement en (astro)physique et de la façon d’améliorer les simulations/modèles malgré les effets d’une physique inconnue, ce qui pourrait mener à des améliorations de la généralisation des modèles d’AA en fonction de nouvelles données. En d’autres termes, l’(astro)physique pourrait permettre à l’apprentissage automatique de mieux « apprendre à apprendre ».
- Parmi les exemples concrets d’application de techniques (astro)physiques et cosmologiques à l’AA, citons l’association d’approches mécaniques statistiques et de méthodes d’AA basées sur le flot normalisant pour la mise au point d’un algorithme d’inférence bayésienne d’usage général, ainsi que l’adaptation de la dynamique relativiste et conservatrice d’énergie de Born-Infeld utilisée pour décrire le comportement de champs scalaires dans les paysages d’énergie potentielle dans certains modèles d’inflation cosmique, comme solution de rechange à la méthode de descente de gradient stochastique couramment utilisée à des fins d’optimisation en AA. Il est aussi possible d’utiliser des techniques physiques pour analyser (et peut-être améliorer) le comportement des modèles d’AA en ce qui concerne l’augmentation de la taille du modèle (nombre de paramètres), la taille de l’ensemble de données et la quantité de calcul, sous forme de lois d’échelle.
- Il est possible d’établir une analogie entre les architectures d’IA — en tant que réseaux hiérarchiques multiéchelles à travers lesquels l’information circule — et la formation et l’évolution des structures à grande échelle dans l’Univers. Par conséquent, les approches et les méthodologies qu’utilisent les cosmologues pour comprendre, par exemple, l’émergence de la toile cosmique à partir de l’information quantique pourraient guider la conception d’architectures d’IA plus explicables et interprétables.
- Sur un plan plus fondamental, l’étude des modèles d’AA ou des réseaux neuronaux en tant que phénomènes physiques, comme un système de particules en interaction, pourrait éventuellement faire avancer notre compréhension théorique de l’AA.
Membres de l’atelier
- J. Richard Bond, professeur, Institut canadien d’astrophysique théorique, Université de Toronto / membre, programme Extrême Univers et gravité, CIFAR
- Man Leong (Mervyn) Chan, stagiaire postdoctoral, Université de la Colombie-Britannique
- Audrey Durand, professeure adjointe, Université Laval / titulaire de chaire en IA Canada-CIFAR, Mila
- Cora Dvorkin, professeure agrégée, Université Harvard / chercheuse principale, NSF AI Institute for Artificial Intelligence and Fundamental Interactions
- Sébastien Fabbro, spécialiste de l’informatique scientifique, Centre canadien de données astronomiques, Centre de recherche Herzberg en astronomie et en astrophysique, Conseil national de recherches du Canada
- Daryl Haggard, professeure agrégée et titulaire de la Chaire de recherche du Canada en astrophysique multi-messagers, Université McGill / membre du programme des chercheurs mondiaux CIFAR-Azrieli, programme Extrême Univers et gravité, CIFAR
- Yashar Hezaveh, professeur adjoint et titulaire de la Chaire de recherche du Canada sur l’analyse de données astrophysiques et l’apprentissage automatique, Université de Montréal
- Renée Hložek, professeure adjointe, Université de Toronto / membre du programme des chercheurs mondiaux CIFAR-Azrieli, programme Extrême Univers et gravité, CIFAR
- Shirley Ho, cheffe de groupe, cosmologie et sciences des données, Institut Flatiron
- Jared Kaplan, professeur agrégé, Université Johns Hopkins / cofondateur, Anthropic
- Victoria Kaspi, professeure et directrice de l’Institut spatial de McGill, Université McGill / responsable et titulaire de bourse de la Fondation R. Howard Webster, programme Extrême Univers et gravité, CIFAR
- Juna Kollmeier, professeure et directrice de l’Institut canadien d’astrophysique théorique, Université de Toronto / membre, programme Extrême Univers et gravité, CIFAR
- Flavie Lavoie-Cardinal, professeure adjointe et titulaire de la Chaire de recherche du Canada en nanoscopie intelligente de la plasticité cellulaire, Université Laval
- Luis Lehner, chercheur universitaire, Institut Périmètre / membre, Extrême Univers et gravité, CIFAR
- Adrian Liu, professeur adjoint, Université McGill / membre du programme des chercheurs mondiaux CIFAR-Azrieli, programme Extrême Univers et gravité, CIFAR
- Ashish Mahabal, scientifique en chef, calculs et données, Center for Data Driven Discovery, Institut de technologie de la Californie
- Alexander Maloney, professeur, Université McGill
- Jess McIver, professeure adjointe et titulaire de la Chaire de recherche du Canada en astrophysique des ondes gravitationnelles, Université de la Colombie-Britannique
- Laurence Perreault Levasseur, professeure adjointe, Université de Montréal / membre associée, Mila
- Siamak Ravanbakhsh, professeur adjoint, Université McGill / titulaire de chaire en IA Canada-CIFAR, Mila
- Nayyer Raza, étudiant diplômé, Université McGill
- Daniel Roberts, chercheur principal, Salesforce / affilié à la recherche, Centre de physique théorique, MIT
- Uroš Seljak, professeur et directeur, Centre de physique cosmologique de Berkeley, Université de la Californie à Berkeley
- Eva Silverstein, professeure, Université Stanford / spécialiste-conseil, programme Extrême Univers et gravité, CIFAR
- Ingrid Stairs, professeure, Université de la Colombie-Britannique / membre, programme Extrême Univers et gravité, CIFAR
- Scott Tremaine, professeur, Université de Toronto / responsable du comité consultatif, programme Extrême Univers et gravité, CIFAR
- Simon White, directeur émérite, Institut Max-Planck d’astrophysique / spécialiste-conseil, programme Extrême Univers et gravité, CIFAR
Lectures complémentaires
Ressources du CIFAR :
Algorithmes en astronomie et en biomédecine (compte-rendu d’événement)
L’IA au service de l’astronomie et de la santé (compte-rendu de recherche)
La recherche en IA permet une percée en astronomie (nouvelles du CIFAR)
Exploration de l’inconnu (nouvelles du CIFAR)
Autres ressources :
GWSkyNet-Multi: A Machine-learning Multiclass Classifier for LIGO–Virgo Public Alerts, par Thomas Abbott et coll.
Discovering Symbolic Models from Deep Learning with Inductive Biases, par Miles Cranmer et coll.
Translation and Rotation Equivariant Normalizing Flow (TRENF) for Optimal Cosmological Analysis, par Biwei Dai et Uroš Seljak
Machine Learning and Cosmology, par Cora Dvorkin et coll.
Born-Infeld (BI) for AI: Energy-Conserving Descent (ECD) for Optimization, par G. Bruno De Luca et Eva Silverstein
Recovering the Wedge Modes Lost to 21-cm Foregrounds, par Samuel Gagnon-Hartman et coll.
Scaling Laws for Autoregressive Generative Modeling, par Tom Henighan et coll.
Simulation-Based Inference of Strong Gravitational Lensing Parameters, par Ronan Legin et coll.
Rediscovering Orbital Mechanics with Machine Learning, par Pablo Lemos et coll.
The Principles of Deep Learning Theory, par Daniel Roberts et coll.
Going Beyond the Galaxy Power Spectrum: an Analysis of BOSS Data with Wavelet Scattering Transforms, par Georgios Valogiannis et Cora Dvorkin
Machine Learning Advantages in Canadian Astrophysics, par Kim Venn et coll.
Modeling Assembly Bias with Machine Learning and Symbolic Regression, par Digvijay Wadekar et coll.
Pour de plus amples renseignements, veuillez communiquer avec :
Johnny Kung
Spécialiste responsable, Mobilisation du savoir et Publications
CIFAR
johnny.kung@cifar.ca