Par: Krista Davidson
10 Mar, 2025
Richard S. Sutton et Andrew G. Barto remportent le prix A.M. Turing 2024 décerné par l’Association for Computing Machinery (ACM) pour leur contribution aux bases conceptuelles et algorithmiques de l’apprentissage par renforcement. Considéré comme le « prix Nobel de l’informatique », cet honneur – l’un des plus prestigieux du domaine – s’accompagne d’une bourse de 1 M$ US. Avec ce prix, les conseillers scientifiques en chef des trois Instituts nationaux d’IA – à savoir l’Amii, Mila et l’Institut Vecteur – sont maintenant tous lauréats du prix Turing, preuve de l’incroyable dynamisme du Canada en matière de recherche et d’expertise en IA.
Richard Sutton est conseiller scientifique en chef de l’Amii, titulaire de chaire en IA Canada-CIFAR et membre auxiliaire du programme Apprentissage automatique, apprentissage biologique du CIFAR. Il est également professeur d’informatique à l’Université de l’Alberta. Andrew G. Barto est professeur émérite en sciences de l’information et en informatique à l’Université du Massachusetts Amherst. Avec leur équipe de collaborateurs et de collaboratrices, le tandem a mis au point des approches algorithmiques fondamentales en apprentissage par renforcement telles que l’apprentissage par différences temporelles, l’une de leurs contributions les plus remarquables.
« Dans une série d’articles publiés à partir des années 1980, Barto et Sutton ont mis en place les grands concepts, jeté les bases mathématiques et développé des algorithmes importants pour l’apprentissage par renforcement, l’une des approches les plus déterminantes pour l’élaboration de systèmes intelligents », écrit l’ACM.
Ces avancées fondamentales en apprentissage par renforcement (un domaine de l’apprentissage automatique dans lequel des agents intelligents tirent des apprentissages de leurs interactions avec l’environnement, un peu comme le font les êtres humains et les animaux) se sont avérées d’une importance cruciale pour l’avancement d’utilisations concrètes comme les véhicules automatiques et des agents conversationnels tels que ChatGPT. Ces systèmes utilisent les ressources de l’intelligence par renforcement à partir de rétroaction humaine (Reinforcement Learning from Human Feedback, ou RLHF en anglais) pour réaliser des apprentissages et améliorer la qualité de leurs réponses en fonction de leurs interactions avec les utilisateurs et utilisatrices.
« Au nom de toute la communauté du CIFAR, j’offre mes plus sincères félicitations à Rich Sutton et à Andrew Barto pour cet insigne honneur, affirme le président et chef de la direction du CIFAR, Stephen Toope. Il s’agit d’une belle marque de reconnaissance quant à l’importance de leur contribution au développement de l’apprentissage par renforcement et des retombées sociétales considérables qu’elle pourrait avoir aujourd’hui et à l’avenir. »
« Ce prix montre l’importance des investissements précoces et soutenus dans la recherche et les talents en IA, déclare Elissa Strome, directrice générale de la Stratégie pancanadienne en matière d’IA au CIFAR. Il a fallu des décennies d’investissement pour permettre au Canada d’asseoir son leadership en matière de recherche et d’expertise en IA, un leadership décuplé par l’établissement de la Stratégie pancanadienne en matière d’IA en 2017. Rich Sutton est l’une des sommités de l’écosystème canadien de l’IA et a joué un rôle moteur essentiel à son essor et à sa prospérité. Ses travaux ont contribué à établir des concepts et des algorithmes fondamentaux en apprentissage par renforcement. L’IA ne serait pas ce qu’elle est sans ces idées et contributions décisives. »
Richard Sutton s’est joint à la communauté du CIFAR en 2015 à titre de membre auxiliaire du programme Apprentissage automatique, apprentissage biologique, l’un des premiers programmes de recherche au Canada consacrés à l’étude de l’apprentissage comme moyen, pour le cerveau et les systèmes artificiels, de gagner en intelligence.
Depuis 2021, M. Sutton est titulaire de chaire en IA Canada-CIFAR, un programme phare de la Stratégie pancanadienne en matière d’IA conçu pour attirer et retenir au Canada les meilleurs éléments du monde en IA.
Richard Sutton est un grand penseur qui, à travers l’informatique, cherche à mieux comprendre l’être humain et le monde qui l’entoure. « L’intelligence artificielle, même si elle contient le mot artificiel, [vise] à répondre à la question fondamentale qui consiste à savoir qui je suis, comment je fonctionne et quel est mon rôle dans l’univers », a déclaré Richard Sutton au CIFAR en 2020.
Au cours de sa carrière, M. Sutton a servi de mentor à des centaines de personnes grâce à son soutien indéfectible à l’École d’été sur l’apprentissage profond et l’apprentissage par renforcement (APAR) du CIFAR, le premier programme de formation en IA du Canada qui attire quelques-uns des plus brillants cerveaux au monde. Le CIFAR est ravi d’annoncer que Richard Sutton sera de retour à l’École d’été sur l’APAR pour l’édition 2025, qui sera organisée à Edmonton en partenariat avec l’Amii.
Richard Sutton n’est pas le seul chercheur affilié au CIFAR à recevoir le prix Turing. Yoshua Bengio, Geoffrey Hinton et Yann LeCun ont tous trois obtenu ce prix prestigieux pour leur contribution au développement de l’apprentissage profond en 2019.
Pour sa part, Geoffrey Hinton, spécialiste-conseil pour le programme Apprentissage automatique, apprentissage biologique du CIFAR, professeur émérite à l’Université de Toronto et conseiller scientifique en chef de l’Institut Vecteur, s’est vu décerner le prix Nobel de physique en octobre 2024, de concert avec John Hopfield de l’Université de Princeton, pour des découvertes qui rendent possible l’apprentissage automatique avec les réseaux de neurones artificiels.