Suis nous sur
Dale Schuurmans-BW_F

Dale Schuurmans

Titre

  • Titulaire de chaire en IA Canada-CIFAR
  • Stratégie pancanadienne en matière d’IA

À Propos

Les recherches de Dale Schuurmans portent depuis toujours sur le développement de l’intelligence artificielle. Se concentrant principalement sur les fondements algorithmiques de l’apprentissage automatique, elles sont fondées sur le fait que l’amélioration autonome des capacités et l’adaptation à de nouvelles circonstances sont des caractéristiques de l’intelligence. L’apprentissage automatique permet de développer des capacités ciblées dans les domaines de l’interprétation sensorielle, de l’interprétation du langage, du raisonnement efficace et du comportement. 

Dale Schuurmans se concentre actuellement sur le développement d’algorithmes qui permettent d’acquérir des compétences grâce à l’intégration de l’apprentissage par la démonstration et par l’expérience. Ce travail s’appuie sur les avancées récentes suivantes :

  1. la combinaison de l’apprentissage par renforcement basé sur les valeurs et celui basé sur les politiques ;
  2. la mise en relation de l’apprentissage par renforcement « avant » et inverse ;
  3. l’extension des méthodes d’apprentissage par renforcement conformes aux politiques (on-policy) et hors politiques (off-policy) pour exploiter les démonstrations ;
  4. l’exploitation des concepts d’équilibre de la théorie des jeux.

Prix

  • Prix du meilleur article, NeurIPS 2018
  • Boursier, Association pour l’avancement de l’intelligence artificielle (AAAI), 2017
  • Chaire de recherche du Canada en apprentissage automatique, 2008-2018
  • Prix du meilleur article, IJCAI, 2005
  • Prix du meilleur article, AAAI, 2000

Publications Pertinentes

  • J. Mei, C. Xiao, B. Dai, L. Li, C. Szepesvari, D. Schuurmans. « Escaping the gravitational pull of softmax », Advances in Neural Information Processing Systems 33 (NeurIPS 2020).
  • M. Yang, O. Nachum, O., B. Dai, L. Li, D. Schuurmans. « Off-policy evaluation via the regularized Lagrangian », Advances in Neural Information Processing Systems 33 (NeurIPS 2020).
  • J. Wen, B. Dai, L. Li, D. Schuurmans. « Batch stationary distribution estimation », Proceedings of the 37th International Conference on Machine Learning (ICML), 12-18 juillet 2020, virtuel.
  • M. Chen, R. Gummadi, C. Harris, D. Schuurmans. « Surrogate objectives for batch policy optimization in one-step decision making », Advances in Neural Information Processing Systems 32 (NeurIPS 2019).
  • T. Lu, C. Boutilier, D. Schuurmans. « Overcoming delusional bias in value-based planning and reinforcement learning », Advances in Neural Information Processing Systems 31 (NeurIPS 2018).

Soutenez-nous

Le CIFAR est un organisme de bienfaisance enregistré qui reçoit le soutien des gouvernements du Canada, de l’Ontario, de l’Alberta et du Québec, ainsi que de fondations, de donateurs individuels, d’entreprises et de partenaires canadiens et internationaux.

Centre MaRS, tour Ouest
661, avenue University, bureau 505
Toronto (Ontario) M5G 1M1 Canada